什么是big data?

Big data”(大数据)的称呼已经火了很长一段时间了。今天我查阅了一些资料,记录一下自己的理解。“Big data”应该包含以下两个方面的含义:

(1)数据量本身很庞大。现在一款几亿人使用的社交软件可以聊天,上传图片,推送文章,发语音信息,等等。一个人可能一天就要产生几M到几十M的信息,那么几亿人一年会产生多少?真是一个非常大数量级的数据。

(2)伴随处理这些大数量级的数据所产生的技术。我们传统处理数据的方法已不再适合处理这些大规模数据了,所以要不断探索和解决这些技术难题。例如:如何存储这些数据,如何寻找特定的数据,如何从这些数据中挖掘出一些有用的信息,等等。

但是,每个问题都有两面性,“Big data”也不例外。一个显著的问题就是用户的隐私。你的社交软件知道了你的太多信息:你的手机号码,你的联系人,你喜欢看什么,等等。也许它比你还了解你。。。

参考资料:
(1)big data
(2)A (very) short history of big data
(3)Big Data

发表评论

电子邮件地址不会被公开。 必填项已用*标注

This site uses Akismet to reduce spam. Learn how your comment data is processed.