每天都听到大数据这个词,领导离开这个词都无法正常说话 ...

来源:百度文库 编辑:超级军网 时间:2024/04/28 12:58:42
我的理解是大数据应该更加偏向可以用信息论的那一套理论来解释,它的分析,运算,结果初步筛选都是一步步从微观建模到宏观,看似可以居高统领全局,但是谁也无法破坏这个生态系统,每个实体在大数据系统面前都是多生物特征,你可以有信道噪音,有加密协议,但是以格的观点来看,要建立可信的交易,巨鳄只能区分食物的价值,建立上限的bound和下限的bound,并且让高阶食物对低阶食物进行扑食,从而自己只需要进食高阶食物。最明显的应用就是旧有的私募基金转变为众募平台,这些小生物的核心价值由于行业的利润来源不同而不同。

而数据挖掘是一种被动的,系统论的看法,它认为世间上的万事万物的联系可以通过互联网金融研发人员不断的算法优化从而掩盖掉食物链顶端生物不需要的数据或它们需要掩盖的联系并且在与普通用户的交互过程中并不暴露这种掩盖基于的原有特定算法,从而建立起有利自己的游戏规则,甚至将红海重新变成蓝海,领军者再对每块利润的分划像一个不断循环的simulator,每次产生的记录都无法重现原有的算法,以多变量的观点来看,它的不可分析安全性来源原本运算时候足够的计算复杂性。最典型的应用就是私募转众募的时候,我们可以对于特定众募平台未来5年10年成功率进行规则以上,规则以下的干预。

总是感觉自己数学学得一塌糊涂,身边数学系,物理系,生物系都可以完整的用数学的观点去阐述每一种新型的杠杠工具,而我总是好读书不得皮毛。既然这个概念是搞计算机的孩子发明的,学计算机的孩子们是怎么分析这两者的异同呢?我的理解是大数据应该更加偏向可以用信息论的那一套理论来解释,它的分析,运算,结果初步筛选都是一步步从微观建模到宏观,看似可以居高统领全局,但是谁也无法破坏这个生态系统,每个实体在大数据系统面前都是多生物特征,你可以有信道噪音,有加密协议,但是以格的观点来看,要建立可信的交易,巨鳄只能区分食物的价值,建立上限的bound和下限的bound,并且让高阶食物对低阶食物进行扑食,从而自己只需要进食高阶食物。最明显的应用就是旧有的私募基金转变为众募平台,这些小生物的核心价值由于行业的利润来源不同而不同。

而数据挖掘是一种被动的,系统论的看法,它认为世间上的万事万物的联系可以通过互联网金融研发人员不断的算法优化从而掩盖掉食物链顶端生物不需要的数据或它们需要掩盖的联系并且在与普通用户的交互过程中并不暴露这种掩盖基于的原有特定算法,从而建立起有利自己的游戏规则,甚至将红海重新变成蓝海,领军者再对每块利润的分划像一个不断循环的simulator,每次产生的记录都无法重现原有的算法,以多变量的观点来看,它的不可分析安全性来源原本运算时候足够的计算复杂性。最典型的应用就是私募转众募的时候,我们可以对于特定众募平台未来5年10年成功率进行规则以上,规则以下的干预。

总是感觉自己数学学得一塌糊涂,身边数学系,物理系,生物系都可以完整的用数学的观点去阐述每一种新型的杠杠工具,而我总是好读书不得皮毛。既然这个概念是搞计算机的孩子发明的,学计算机的孩子们是怎么分析这两者的异同呢?
数据挖掘是一类算法的统称。它可以应用于大数据,也可以应用于小数据。

大数据是一个相对概念,指的是用当前的处理方式,无法准确捕捉,管理,处理的数据集合。它包含了数据的采集,数据的存储和处理三个过程。

几百年前的大数据,在今天看来就是小数据;同样,今天的大数据,几十年后,可能就是小数据。

数据挖掘这类算法,在大数据的处理环节被广泛应用,是主要算法,但并非唯一。
熊首督军 发表于 2015-7-16 07:36
数据挖掘是一类算法的统称。它可以应用于大数据,也可以应用于小数据。

大数据是一个相对概念,指的是用 ...

那么从计算机的角度出发,大数据,小数据永远只是一个随时间变化而对数据的宏观规模大小的估计,这是一个会发生变化的动态称呼而已,而数据挖掘算法是一个常用的工具,我的理解对吗?
那么从计算机的角度出发,大数据,小数据永远只是一个随时间变化而对数据的宏观规模大小的估计,这是一 ...
坦率的说,本来我觉得比较清晰的概念,被你这么一归纳就变得一团糟了。总是没反应出有用的东西来。

我重新理。
”对数据进行统计、分析“说的时髦点就叫”大数据“............
逸仙润之尊仲尼 发表于 2015-7-16 02:06
那么从计算机的角度出发,大数据,小数据永远只是一个随时间变化而对数据的宏观规模大小的估计,这是一 ...
也不能这么说。现在说的“大数据”指的是一种策略,数据挖掘是实现这个策略的方法,两者不是一个层面的概念。

打个比方,我们要“可持续发展”,通过“再生回收”来实现“可持续发展”。
统计与决策
我的理解:
大数据,侧重于集合概念,比如张三午饭吃的米饭、张三的老板开的是二手宝马……
数据挖掘,侧重数据分析,比如张三老板生意不好,员工奖金减半,张三午餐就只能吃米饭了
熊首督军 发表于 2015-7-16 19:47
坦率的说,本来我觉得比较清晰的概念,被你这么一归纳就变得一团糟了。总是没反应出有用的东西来。

我 ...
这是我不对啊,我就一直没有搞明白这个关系,反而自己讲出来把别人搞晕了
general_j 发表于 2015-7-18 00:22
也不能这么说。现在说的“大数据”指的是一种策略,数据挖掘是实现这个策略的方法,两者不是一个层面的概 ...
大数据不能算是策略吧,只是一种新型的统计工具?
jnjn9988 发表于 2015-7-18 16:20
我的理解:
大数据,侧重于集合概念,比如张三午饭吃的米饭、张三的老板开的是二手宝马……
数据挖掘,侧 ...
你举的这个例子就是:大数据是分析每个分划是怎么来的,数据挖掘是分析每个每个落在分划里面的实体的属性是怎么样的?
个人以为大数据到终极状态就是掌握数据“总体”,传统上由于信息化水平的不足、技术手段和成本的限制,是通过抽样地方式获得一个规模较小的样本,然后用一定的数据分析方法,来推断总体。而所谓的总体,只不过是一个概念上的东西,类似于盲人摸象,其实质根本无法被彻底认识和掌握。但未来的情况,可能会是一切信息都被记录和利用,传统手段产生的误差与信息丢失将不复存在。而且大部分数据挖掘方法天生就适合对大数据进行分析,所制约的不过是数据来源本身和计算力,随着技术手段的发展,对总体掌握的程度就越深,对个人来说,其结果就是“老大哥在看着你”,甚至不仅是看着你,还能看到你的未来。