西溪老槐 发表于 2015-6-6 15:26:15

sioloong 发表于 2015-5-25 10:32 static/image/common/back.gif
西溪老槐:你好!
我在茶馆潜水很久了。茶馆牛人辈出。看高手论剑,需要勇气才敢发言的。



sioloong:你好!

“全向量数据”是我所在团队提出的一个数据形态的概念。形,指结构,态,指运动状态。葡萄说的是“全量数据”。我觉得有区别,但是相差不是很大的。我们多一个“向”的思想。向,是方向。

做一个不太准确的比喻,当我们讲到古典力学中的“力”的时候,是用方向,大小,作用点这三个侧面去理解的,通过建立起这三个侧面的联系构成力的理念。大数据中的数据本身的发展方向是朝这个方向发展的。我们讲到数据的时候,某个数据是与其他数据之间有着密切的联系。换句话说,其他的数据作为属性构成了这该数据本身。

全向量,是指数据这种联系性非常广泛。某一数据所具备的联系属性是全方位,多维度,其限制受计算能力限制,受数据表达意义异化的限制。

不知道这样说清楚了没有。有问题直接提。

谢谢你的参与,你的提问,让我能更清楚的表达意思。非常感谢!

西溪老槐 发表于 2015-6-6 16:06:10

等而下之 发表于 2015-5-25 21:51 static/image/common/back.gif
百度研究院副院长余凯重磅演讲:从大数据到人工智能

这周六,百度研究院副院长余凯在 Santa Clara 的  ...

等而下之:你好!

余凯发言最有意义的是对人工智能的“定义”。这个定义最有意思的是第二点,“对环境、对对话的对象有一些理解”。他比较保守,说“有一些理解”。的确如此。这是只拦路虎。

以汉语的语音识别为例。你真好!这句话,如果重音位置不同,表达的人际意义不同;音调不同,意思表达的真假不同。这些东西,光靠现在的大数据,现在的人工智能还不能解决。这种话有情绪的成分。当下的人工智能技术还不能完成这个任务。

如果要说余氏有弱项的话,就是他所提出的深度学习理念。当代认知心理学的内容比他所述更为深刻和全面。彼得·圣吉的“学习型团队”也比较全面的表述了这个理念。如果余氏能从“认知及大脑科学”方面表述,可能更为积极。也许这样公开的讲授,保守和保密是必须的,回避是正当的。

谢谢你的提供的信息,非常感谢!

等而下之 发表于 2015-6-7 16:54:05

西溪老槐 发表于 2015-4-24 21:38 static/image/common/back.gif
等而下之:你好!

这篇文章中,最关键的是云技术的保密问题。这是云技术的天生的问题。大数据依赖云的 ...

调查显示大部分美国人已经放弃个人数据隐私权

一份来自宾夕法尼亚州大学的研 究显示,美国民众已经丧失了对自身数据隐私不受到侵犯的希望 。
http://tech.163.com/15/0607/09/ARGD8NVD000915BD.html

weakleilei 发表于 2015-6-7 17:05:06

spacejam 发表于 2015-5-30 09:04 static/image/common/back.gif
是的,
如果把比特币当作计算量(计算机的无差别人类劳动),
那就很适合马克思的理论。


比特币是无差别计算?
你对比特币的认识为免太简单了点。

warmanky 发表于 2015-6-8 14:15:22

这个时候谈云的莫非对几天前支付宝事故视而不见么:lol,现在的云跟十年前卖主机托管没啥本质区别,有区别的是自动化管理软件普及了,更方便些而已。我对大数据的关注是能否颠覆掉传统关系型数据库,这个才是真正云时代的到来,可惜现在核心的企业级应用还是建立在关系型数据库基础之上。

warmanky 发表于 2015-6-8 14:37:44

西溪老槐 发表于 2015-6-6 15:26 static/image/common/back.gif
sioloong:你好!

“全向量数据”是我所在团队提出的一个数据形态的概念。形,指结构,态,指运动状态 ...

我们公司很早使用了Hyperion预算管理系统,就是向量数据库,不知道跟您这说的全向量数据有多大差别?

西溪老槐 发表于 2015-6-13 13:36:43

warmanky 发表于 2015-6-8 14:37 static/image/common/back.gif
我们公司很早使用了Hyperion预算管理系统,就是向量数据库,不知道跟您这说的全向量数据有多大差别?

warmanky:你好!

以我对Hyperion的了解,它的向量主要是指计算机在处理数据时的操作层面的内容。它的“向量”是相对数据本身处理过程而言的。是指数组的抽象与泛化,由一组元素按线性次序封装而成各元素与内在{0,n}内在秩。它的意义在于与此相对应的元素类型不限于基本类型,可以不同的逻辑关系共同存在。维护、管理、操作可以更加安全、简便、统一。特别是最后一点“统一”,它是数据库更加方便的参与非常复杂结构的的数据的制定和实现的基础。

全向量数据中的“向”,是指数据代表的事物运动方向的数与量。我类举了力的概念,它有三个要点,大小,方向,作用点。你再体会一下。

虽然向量数据库为处理复杂数据提供了一种途径,但是,以当下计算机的能力来看,完成真正大数据处理还是相当困难的。所以,另外一条路,是重新定义大数据的“数据”。这涉及人们对事物的新认识,和技术上的取样标准和时点。后者,我只能讲到这里。请多多包涵。

谢谢你的参与和提问。非常感谢!

西溪老槐 发表于 2015-6-13 14:09:01

本帖最后由 西溪老槐 于 2015-6-13 14:12 编辑

warmanky 发表于 2015-6-8 14:15 static/image/common/back.gif
这个时候谈云的莫非对几天前支付宝事故视而不见么,现在的云跟十年前卖主机托管没啥本质区别,有区别的 ...
warmanky:你好!

支付宝事故是物理性事件,表明了云要在实体技术上有坚实的保障。人们一般聊云的时候,是假设物理保障是实现的。云的缺陷,主要不是你说的那些。

至于颠覆传统的关系型数据库,现在的NoSQl已经差不多要实现这个目标了。虽然,我很钟情和拿手关系型数据库。如果有条件找到“透明计算”的资料看看,NoSQl存在的问题基本解决了。

企业的问题,多是经济问题。技术为经济服务的结果。

谢谢你的参与,非常感谢你的回复。谢谢!

葡萄 发表于 2015-6-13 22:58:56

西溪老槐 发表于 2015-6-13 14:09 static/image/common/back.gif
warmanky:你好!

支付宝事故是物理性事件,表明了云要在实体技术上有坚实的保障。人们一般聊云的时候 ...

张北的阿里大数据中心和苹果打数据中心是对应的尝试。试错的一部分尝试。新事物,姑且观察。

葡萄 发表于 2015-6-13 23:01:27

warmanky 发表于 2015-6-8 14:15 static/image/common/back.gif
这个时候谈云的莫非对几天前支付宝事故视而不见么,现在的云跟十年前卖主机托管没啥本质区别,有区别的 ...

业界去年底开始的三个尝试方向,去云端 ,去IT,向下沉淀的智能化。

葡萄 发表于 2015-6-13 23:02:14

西溪老槐 发表于 2015-6-13 13:36 static/image/common/back.gif
warmanky:你好!

以我对Hyperion的了解,它的向量主要是指计算机在处理数据时的操作层面的内容。它的 ...

多谢,你的解释让我对我老师的解释从似是而非的一知半解有了点理解。

dkgeki 发表于 2015-6-14 08:24:06

葡萄 发表于 2015-6-13 22:58 static/image/common/back.gif
张北的阿里大数据中心和苹果打数据中心是对应的尝试。试错的一部分尝试。新事物,姑且观察。

Amazon在服务器的物理分布和备份上已经有一套办法了,不知道阿里苹果做的怎么样

葡萄 发表于 2015-6-14 15:18:14

dkgeki 发表于 2015-6-14 08:24 static/image/common/back.gif
Amazon在服务器的物理分布和备份上已经有一套办法了,不知道阿里苹果做的怎么样

纯粹的技术话题我是外行,说的也是基于我信得过的专业人士观点的转述,这里我不乱说我不懂的事情,自己知道什么说什么。

具体再补充前面回复遗漏的内容,比如亚阿里事故的潜在风险。我们自己聚会讨论我的观点,我说当年铁路与公路还有电报与电话线路遇到的潜在风险丝毫不亚于阿里光缆被挖断的风险。但是不会因此阻断了,前面说的那些技术的迅速发展。无他因为他带来的便利性及其利益足以覆盖潜在风险的时候,人们就愿意更大胆的尝试。具体到大数据及其应用是否就能具有同样属性,这我不能说现在我们看到的就是前面提及的风险收益比的确定性。我只能说,那是可能的。并且逻辑上我给出了可能的自洽性,其他让时间来说明。毕竟过于早产的技术也会有他们负面。让结果来说服,其他么各自选择。

我的选择就是,听从一个人的劝告。当看到时代的趋势起来,就毫不犹豫跳进去。我合作伙伴们也认同这样一个观点,我们已经比走在前面的竞争者弱小了,如果还不能快点,快未必就能赢,但是我们我们连这样快一点都没有丝毫意愿一定会输。

dianyou521 发表于 2015-7-3 22:43:06

西溪老槐 发表于 2015-3-27 23:54 static/image/common/back.gif
我不吃青椒:你好!

世界的普遍联系性有没有证实,不同的哲学观答案不同。我是赞同普遍联系的,不然, ...

其实世界是不是普遍联系也许并不太重要,因为毕竟如果一个东西不与其他东西联系,你甚至无法触摸到他,就是nothing,那些最重要的问题大多涉及普遍联系性就够了

葡萄 发表于 2015-8-11 00:12:03

习总在视察贵阳大数据中心后定调了,发展方向正确,安全第一。

mach 发表于 2015-8-11 08:18:40

西溪老槐 发表于 2015-3-27 23:54 static/image/common/back.gif
我不吃青椒:你好!

世界的普遍联系性有没有证实,不同的哲学观答案不同。我是赞同普遍联系的,不然, ...

我觉得世界是无法脱离主观意识的存在。
我们本就是世界的一部分,不识庐山真面目,只缘身在此山中。

黎明の瞳 发表于 2015-8-13 00:13:18

葡萄 发表于 2015-6-13 23:01 static/image/common/back.gif
业界去年底开始的三个尝试方向,去云端 ,去IT,向下沉淀的智能化。

额。不知道您指的是业界是哪一个行业?据我所了解的情况来看,国内的大数据还停留在数据抓取和数据库建立的阶段,数据分析基本就没有展开。很简单的道理,这个行业的把关人多半来自于数据库或者别的IT行业,他们并不了解什么叫数理分析。其实,数据分析也不能算新行业,毕竟它来自于数理统计。国内的大数据还至少需要一两年的时候才能让这个行业开始有一些标准。

广州仁者 发表于 2015-8-13 10:29:56

黎明の瞳 发表于 2015-8-13 00:13 static/image/common/back.gif
额。不知道您指的是业界是哪一个行业?据我所了解的情况来看,国内的大数据还停留在数据抓取和数据库建立 ...

数据分析已经很实用化了,比如电子商务领域,近几年数据分析已是常态化的工作内容。

葡萄 发表于 2015-8-15 04:03:41

本帖最后由 葡萄 于 2015-8-15 04:05 编辑

依托数字化进化的组织形式演化,京津翼一体化扩容与整合已经催生了相关行政体制改革的新架构。这个架构一旦成功。不亚于当年几次历史上重大中央集权体制结构调整的影响。比如设三省提调中枢对应的刺史,设六部以分相权对应的按查御史制度,设军机对应的六部章京行走下的巡查机制,以及对应三者的中层架构与基层架构的调整,结合信息化的推进到此已经势在必行。具体结果,且静观之或置身其间,两由之。

恩。。。天津的事故是加速这一进程的契机,也是偶发事件引导出必然结果的一个见证。

葡萄 发表于 2015-8-15 04:10:11

黎明の瞳 发表于 2015-8-13 00:13
额。不知道您指的是业界是哪一个行业?据我所了解的情况来看,国内的大数据还停留在数据抓取和数据库建立 ...

是对IT技术的2014回顾与展望2015提出这个观点的。信息技术年会的主题。这个协会包含的范畴就是我说的业界。不过,现在只看数据分析一个层面都是问题。有些信息化改革,从底层的信息元都完全是错的,必须重来。你再看看我今天的回复,这一个与老槐大数据一帖子里的时间点与这个帖子接近的内容。都是一个整体架构的一部分。有坚定方向性,也有不断摸索试错中的过程。算一个问题的不同侧面吧。

西溪老槐 发表于 2015-8-15 21:09:50

mach 发表于 2015-8-11 08:18 static/image/common/back.gif
我觉得世界是无法脱离主观意识的存在。
我们本就是世界的一部分,不识庐山真面目,只缘身在此山中。

mach:你好!

辩证唯物主义恰好认为意识是这个世界的一部分。对立统一观认为物质与意识相依存而存在。同时认为意识是物质的反映。

在我所看的哲学诸个体系中,你的话是接近马克思主义哲学对世界的描述。

谢谢你的参与。谢谢!

dianyou521 发表于 2015-8-15 21:30:37

西溪老槐 发表于 2015-8-15 21:09 static/image/common/back.gif
mach:你好!

辩证唯物主义恰好认为意识是这个世界的一部分。对立统一观认为物质与意识相依存而存在。 ...

真正重要的是物质与意识如何依存,抽象讲依存用处不大的

西溪老槐 发表于 2015-8-16 09:51:32

dianyou521 发表于 2015-8-15 21:30 static/image/common/back.gif
真正重要的是物质与意识如何依存,抽象讲依存用处不大的

dianyou521:你好!

我是针对mach的回帖而言的,是对他的言语与马克思主义哲学关系的的描述。并没有试图对马克思主义哲学进行展开论述。也不可能因为我认为对方言语所表达的意思与马克思主义哲学接近而转移话题,去对马克思主义哲学长篇大论一番。只能依据对方所聊的层面而论。不然,文不对题就不太尊重对方和过于自我了。

由于主贴是关于大数据的,聊哲学的基础内容,楼太偏了,让读者一头雾水。你看这样行不行,你有意展开这个话题的话,开个新贴吧。把你的观点,或者认为某些观点不正确,做一个较全面的论述一下。展开一下。我也好理解,学习与唱和。以免得理解错误。言非所答。

谢谢你的参与。非常感谢!

dianyou521 发表于 2015-8-16 13:25:45

西溪老槐 发表于 2015-8-16 09:51 static/image/common/back.gif
dianyou521:你好!

我是针对mach的回帖而言的,是对他的言语与马克思主义哲学关系的的描述。并没有试 ...

我发了个问题贴

黎明の瞳 发表于 2015-8-17 08:59:44

本帖最后由 黎明の瞳 于 2015-8-17 09:30 编辑

广州仁者 发表于 2015-8-13 10:29 static/image/common/back.gif
数据分析已经很实用化了,比如电子商务领域,近几年数据分析已是常态化的工作内容。
电商领域的数据分析能力其实不怎么样。你要说分析,金融行业的分析还算比较好。电商只能算以量取胜。电商那一块,能做推荐算法就可以混的很好了。金融类比那些复杂多了。阿里巴巴的天池大数据竞赛,其实就是推荐算法,能进前??名,就可以成为阿里巴巴的员工。阿里巴巴还算是电商那一块做的比较深的。

黎明の瞳 发表于 2015-8-17 09:17:43

葡萄 发表于 2015-8-15 04:10 static/image/common/back.gif
是对IT技术的2014回顾与展望2015提出这个观点的。信息技术年会的主题。这个协会包含的范畴就是我说的业界 ...

好吧。但愿如此吧。希望这个行业能进度加快一些。

唯识无境 发表于 2015-8-18 03:09:27

黎明の瞳 发表于 2015-8-13 00:13 static/image/common/back.gif
额。不知道您指的是业界是哪一个行业?据我所了解的情况来看,国内的大数据还停留在数据抓取和数据库建立 ...

怎么可能没展开,你看淘宝上你点一个产品它会推荐另外一堆产品,这个件就是基于数据挖掘推荐的.

广州仁者 发表于 2015-8-18 10:20:40

黎明の瞳 发表于 2015-8-17 08:59 static/image/common/back.gif
电商领域的数据分析能力其实不怎么样。你要说分析,金融行业的分析还算比较好。电商只能算以量取胜。电商 ...

数据分析是为决策服务的,现在做电商的日常大小决策都离不开数据分析,实用是硬道理。

再说说阿里,人家的数据分析水平怎样先放一边,关键是人家的数据来源靠谱,海量的客观消费行为数据,简单分析一下都可以拿去卖钱了。  否则,一堆不靠谱的垃圾数据,再高明的算法,开天河二号也分析不出啥 :lol

黎明の瞳 发表于 2015-8-18 21:09:23

本帖最后由 黎明の瞳 于 2015-8-18 23:14 编辑

广州仁者 发表于 2015-8-18 10:20 static/image/common/back.gif
数据分析是为决策服务的,现在做电商的日常大小决策都离不开数据分析,实用是硬道理。

再说说阿里,人 ...
数据分析里面最繁琐的活也是占据最主要的时间的活就是数据清洗。这活你指望别人来做,不太现实。基本流程CRISP-DM(商业理解、数据理解、数据准备、建模、评估、部署),所有核心都是围绕业务展开的,数据只是辅助手段。别人洗出来的数据未必满足你得胃口。

黎明の瞳 发表于 2015-8-18 21:16:34

唯识无境 发表于 2015-8-18 03:09 static/image/common/back.gif
怎么可能没展开,你看淘宝上你点一个产品它会推荐另外一堆产品,这个件就是基于数据挖掘推荐的.

推荐算法~天猫的天池大数据竞赛就是搞得推荐算法。所有可以进入前(??)名的队伍就可以成为阿里巴巴的员工。阿里巴巴还算是国内互联网那一块走的很前的企业。除了这些超一线的互联网企业,其他的互联网企业真心还属于第一步?也许这话都是抬举了。其实你真想了解数据分析的状况,最适合的就是金融领域。
页: 1 2 3 4 5 6 7 [8] 9
查看完整版本: 大数据(二)