偷名提示您:看后求收藏(第322章 有私心的苏小木,宿主脑阔疼,偷名,新笔趣阁),接着再看更方便。

请关闭浏览器的阅读/畅读/小说模式并且关闭广告屏蔽过滤功能,避免出现内容无法显示或者段落错乱。

一群人看着张可大家都不知道今天张可突然召集大家过来做什么。“今天找大家过来是因为所有的课题前准备已经完全完成谭凌你先跟大家简单说一下。”张可也没多啰嗦直接开始了正事。

谭凌点头起身说道。

“经过近一个月的准备前期所有的相关知识储备与小课题实验研究已经全部完成包括课题实验所需的云计算平台、存储、实验参考数据……等均已准备完成……”

“……”

张可接过话头“今天我们便启动『大数据·算法、主导数据与行为模型』课题。”

张可的话语落下后苏小木等人都没有太意外。

这个大课题拖的时间挺长了。

也是时候开始了。

不过大家都有意无意的看了眼苏小木心里都明白张可有很大概率是为了等苏小木完成acm总决赛。

没等大家开口张可问道“你们觉得什么是大数据?”

这个问题问出后苏小木、谭凌、林唐等人都陷入了沉思。

张可教授要听的肯定不是网络上的那些烂而化之的回答。

而是他们每一个人自己的总结。

从生活中、从学习中、从自身经历的方方面面进行总结归纳并给出答案……

一般看来大数据指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。

是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

从技术上看大数据与云计算的关系就像一枚硬币的正反面一样密不可分必须采用分布式架构必须依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术。

同时大数据还需要特殊的技术来有效处理大量的容忍经过时间内的数据。

这些技术包括大规模并行处理数据库、数据挖掘、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。

ibm也曾提出了大数据的特点:大量、高速、多样、低价值密度、真实性。

但大家都不会简单的从这些概念上的东西来进行回答。

良久。

谭凌开口道“我认为大数据就是数量庞大的任意数据甚至这些数据本身并没有什么卵用而且还没什么价值扔之可惜。”

“当然大数据其实始终贯穿着人类的历史从古至今的各种法例都能看到大数据的踪迹。”

“比如连环案件分析?”林唐插嘴道。

也不知道林唐是不是最近看柯南看多了张口就是连环案件。

其他几人各有回答。

独剩下苏小木沉默不语。

“小木同学你来说说?”张可点了名。

苏小木简单的答道“说不好我觉得大数据无非就是多维分析最终针对的还是人。”

“每个人都有每个人对大数据的理解我们的课题只是从大数据出发探索主导数据、行为模型的一个片段。”

张可道。

“大家可以通过课题去找到每个人对大数据的新理解。”

“硬件层面的准备基本完善但软件层面的部署还得我们亲自来首先是分布式文件系统我们讨论一下是否直接使用hadoop实现的分布式文件系统:hdfs?”

张可的问题引发了课题实验组每个成员的意见发表。

首先hdfs基本上是个通用的大数据分布式文件系统最重要的一点是设计就是用来部署在低廉硬件上的。

包括hadoop完全就是为了大数据而开发的程序。

hadoop框架最核心的设计就两点hdfs和mapreduce。

hdfs为海量数据提供了存储方式mapreduce为海量数据提供了计算。

苏小木试图争取了一下“教授如果我们课题的时间足够长的话不如我们试试自己实现不借用hadoop重新设计分布式文件系统、并行运算算法、并行处理数据库这些。”

“这样一来专业针对的就是课题本身的算法、主导数据与行为模型。”

苏小木的话是有道理的当然也是有私心的……

======

2更。

本章未完,点击下一页继续阅读。

武侠修真小说相关阅读More+

江湖之高手无敌

剑哥哥

春华赋

万峰淋立

超级土豪林云王雪全文免费阅读

佚名

一品逍遥侯

威虎山老九

九流道士

感深荆赋

王牌高手

三羊猪猪