rafanadal
发表于 2015-5-2 13:42:22
本帖最后由 rafanadal 于 2015-5-2 13:59 编辑
葡萄 发表于 2015-5-2 13:00 static/image/common/back.gif
你提的前提是有必要商榷的
我自己和朋友们反复讨论的观点之一,没有垃圾数据。回到你的话题,数据再假 ...
忙总关于官僚体系改革有个比喻是刀子再快砍不了刀把。
但我还是无法理解现任中堂的履历,大学毕业后在团中央长达16年(他自己鼓励大学生下基层也说过“宰相必起于州郡,猛将必发于卒伍”。同期586辗转县市地省),然后空降省长(这已经毫无基层经验可言了,486虽然是空降贵州书记毕竟在团中央前有十几年的工作经历)的经历难以理解。以80年代的情况,其外放升迁根本不是问题。
我觉得官僚体系不买他帐才是正常的。
难道就因为他跟既有体系关联少才来当这个改制的?
我不吃青椒
发表于 2015-5-2 17:20:32
本帖最后由 我不吃青椒 于 2015-5-3 12:40 编辑
葡萄 发表于 2015-5-2 13:00 static/image/common/back.gif
你提的前提是有必要商榷的
我自己和朋友们反复讨论的观点之一,没有垃圾数据。回到你的话题,数据再假 ...
我没有参与过改变流程的工作,所以对“流程”的看法纯属个人臆测,如果我说的都对那茶馆就不是茶馆而是中央政治局了。(呵呵呵)
然后说我所说的前提——先有数据的真实性和及时性才能有数据分析的准确性
“没有垃圾数据”和数据真实性是不矛盾的,和数据真实性矛盾的是“假数据”。假数据不是垃圾数据而是有意识的数据欺骗,就像生物的各种防御措施一样。在数据重要性达到一定程度后,数据作假是几乎必然出现的。泛泛而论,我们讨论的不是“是否作假”而是作假做到了什么程度。因为我相信人人作假,就像人人都穿衣服一样,是遮蔽,掩饰,表达的一种内在需求。我怕的不是一个个人,一个组织,甚至一个政府作假。我怕的是你明知道人人作假,又能怎样。假数据的规模是关键。
信息的即时性才是破解假数据的唯一有效武器,因为数据来不及粉饰。正是因为即时层面的信息不可预测它首次出现才越真实。就像新生婴儿连同刚生产完他的母亲一样一览无遗。对于单个事件所造成的数据变化,在那个时点上是最真实的,无论这个事件产生的数据量是1T还是1比特。同一事件越是重复出现,它的真实性就越差。题外话,你今天还能查到当初换届时那个关于“文革余孽”话题的会上发言么?又或者,粉饰好的数据除了当彩票还能做什么。
提个问题,大数据落脚点在哪?对于我不了解的“顶层设计”我也本不想去瞎猜皇帝的金斧头,但我也不愿意如一群瞎子连象都没摸就要讨论象是个什么东西。到现在谁接触过全信息量的数据。谁测试过全信息量数据条件下,找出不断出现的假信息这样的工作。说说我知道的,如果有一天全量据要固定资产化,那么就意味着到目前为止所有的会计准则、政策全部废止。因为在现有准则下,你不能指着人家的账本说这里记录的信息是固定资产。
守望大西瓜
发表于 2015-5-2 18:03:15
我不吃青椒 发表于 2015-5-2 17:20 static/image/common/back.gif
我没有参与过改变流程的工作,所以对“流程”的看法纯属个人臆测,如果我说的都对那茶馆就不是茶馆而是中 ...
你这个假数据 是单个人作假,还是某个部门作假? 全量数据监控下,想要作假,那太蛋疼了。
我不吃青椒
发表于 2015-5-2 18:18:08
本帖最后由 我不吃青椒 于 2015-5-2 18:19 编辑
守望大西瓜 发表于 2015-5-2 18:03 static/image/common/back.gif
你这个假数据 是单个人作假,还是某个部门作假? 全量数据监控下,想要作假,那太蛋疼了。
我的看法是每个人都会作假。但是数据作假只能在完成预测后。所以即时数据的重要性就体现出来。你不能实时预测,但是要实时记录(我的上一段回复修改了三次,虽然修改了几个字,但是过程可以看做我对这段文字所产生影响的预期在微妙变化。这就是最基本的数据修饰。)。当然相关产业竞争,人与人之间的伦理关系,包括激励机制都会发生翻天覆地的变化。这是一个量变最终引发质变的过程,无论完成这个状态需要多少年。
守望大西瓜
发表于 2015-5-2 18:51:44
我不吃青椒 发表于 2015-5-2 18:18 static/image/common/back.gif
我的看法是每个人都会作假。但是数据作假只能在完成预测后。所以即时数据的重要性就体现出来。你不能实时 ...
那这样作假的意义何在?
我不吃青椒
发表于 2015-5-2 20:06:34
本帖最后由 我不吃青椒 于 2015-5-2 20:40 编辑
守望大西瓜 发表于 2015-5-2 18:51 static/image/common/back.gif
那这样作假的意义何在?
有时仅仅是为了表达清楚比如我对文字的修改。但有时候人们作假是产生直接利益的。
所以我的看法是不如把作假限制在一个范围,比如各种“护住脸”措施。使大多数人不必为了遮盖隐私而各种旁门左道。同时要有类似大额可疑这样对异常数据波的检测。因为你拿不到全数据,即便能接触到,你起码不知道谁造了假。这就是我说的这东西发展下去有可能改变人与人之间的伦理关系,没准将来大家都是派自己的“阿凡达”见面聊天吃饭是一种绅士的表现{:soso_e113:}
葡萄
发表于 2015-5-3 15:00:28
我不吃青椒 发表于 2015-5-2 17:20 static/image/common/back.gif
我没有参与过改变流程的工作,所以对“流程”的看法纯属个人臆测,如果我说的都对那茶馆就不是茶馆而是中 ...
你文字中所体现的状态,恰恰是很多论坛讨论中问题的集中体现。既,分不清自己提的问题是基于客观现实的推论,还是基于自己对未知事物的假象。基于数据化社会出现的各种已知现象的推导,并在讨论中总结其中规律,这是分析的基础。而基于假想的任何表述,都是可以归纳为皇帝的金斧子的范畴。
比如对比你的第一段和第三段,对照着看你可以用不知道多少顶层设计的话题来推脱你臆测的背后的行为模式。但是,你最后那段话中,你是否知道已经有银行对于高技术企业的贷款,是基于他公司硬盘的数据来放贷而不只是根据他的办公室有多少其他的固定资产。这就是现实中已经发生的事情。我曾经劝过你,多结合现实中的发展来回头看你试图讨论的问题。本意就是,你不能基于自己的假想讨论问题。并且这样的假象,是不能基于对特定行业特定专业自身特定的有关规律的现实来展开。
比如,我这里讨论的大数据未来治理模型。已经走出了两条很明显的技术路径,一个是物联网下已经出现的新模型,一个是你关注的基于云计算自身走到今天你至今为止论述的集中范畴。我摘两部分我一个朋友在我们昨天聚会讨论后,给我的一篇文章的内容。请注意这是同一篇文章的内容,是一个统一的论述下的不同的数据治理模型的范畴。而这些范畴,涉及的是我们自己在相关领域的投资路径。在我看到你的对大数据与云的理解,这两者恐怕很难在你同一个论述中统一起来。如果你做不到两者的统一,那么你对后面发生的技术演变,以及伴随的治理模式也很难做到你试图做的预测。甚至是盲人摸象都可能有问题。因为,即使是盲人摸象是基于客观现实中的信息碎片,而不是假象的现实中并没有多少现实基础的东西。
>>>>>>>>>>>>>>>>>>>
另一个颠覆性的技术就是云技术。在一个500人的团体里,信息量是500平方等级的;另一个500人团体的信息量也是500平方等级的。如果这两个团体联网,则能产生1000的平方量级的数据量,远远大于两个500的平方。传统扩大网络很简单,就是把这些小的网络连起来,变成一个更大的网络。扩大网络规模带来的增长是几何倍数的。所以,有一个很大的云,要比你把它分散成很多小的网络的价值更多。从这个互联网角度看,人数越多,你提供每个客户的成本就向零无限靠近,你基本上可以提供一个免费的服务。随着云技术的不断发展,介入网络的能力要比实际拥有的所有权要更重要。由于物权是资本主义的基础,现在我们在颠覆所有权,对资本主义就是一个很重要的事情。
....................................
未来数据还有一个趋势:如今很多数据都在洲际间通过海底光缆来传输,是地理位置之间的传输。但今后很多数据会留在本地进行处理,甚至以每个家庭为单位处理的信息总量可能会比留在本地的数据总量还要大。再扩大一个层面来说,我们每个人每天都会产生很多数据。在广播时代,观众人数是一个很大的量级,由广播台去触及;到了互联网时代,出现博客和社会化媒体,你成为了一个广播台,可以拥有很多受众,但你传递的信息量比较少,远远不如广播台;后来出现了微信朋友圈,传递给相对少的受众,但信息的总量非常大。我认为未来就是每一个人传递自己信息的时代。
亚马逊那样的大网站有一个节点去控制很多观众,我们称之为“云”;低一层次的就是一些本地的发送站,我们称之为“雾”;而最底层的称为网格,就是我们每一个人作为接收端。我预言,接下来数据会更多地在每个人的智能设备之间传输,不会回到发射塔、交换机或者“云”里面。我们自己就形成了一个小的局域网。到2020年,超过2/3的信息传送距离不会超过1公里。那么像WiFi、蓝牙技术等目前虽然不是电信级别的技术,不是很严肃,利润很低,市场很小,问题很多,但是不是有可能颠覆未来呢?
最后我想说明的是,我说那么多并没有任何指责你的意思。我是基于你诉求的目的,那个希望跟上现在已经开始的新技术革命的步伐跟上时代变革的那个诉求来展开的。我说了那么多不过是在说,以开放的心态观察新事物的发展,比你我在这里预测什么未来更有意义。只有明白这一点,你才会理解我为什么要在最后部分讨论你的第二段,因为这部分内容对数据分析本身而言意义不大,或者说不是数据分析本来的目的或者说是未来数据社会变革带来的影响很小的一部分。如果你把预测分析当做数据分析的全部哪怕是打半部分,你都不可能去理解我一直强调的话题,大数据改变的不是具体一事一物,他改变的事我们已经知道事物与社会组织的进化速度。为了方便你理解,我举例吧。
最近做中航飞机,有些伙伴拿了八个月,但是错过了最近走强的十多天。让他们最后判断产生分歧的就是你说的,即使的不带修饰的当天交易数据。但是你把日交易k线,拉长到周线和月线看,你可以看到极其强势的操盘节奏。甚至通过这样的方式,从月线与年线数据,我们已经为下一阶段操作选择出了一批有可能能在未来三个月走出两倍甚至三倍的板块及其股票。这就是我说的,当你分析数据的时候,那个全量性。全量数据首先在于一种思维模式,而不在于这个数据到底有多全。这个好比你讨论数据化社会的各种问题,如果不带入数据运作有关进展自身的规律性,或者对这种规律性表示出各种不以为然的态度,你认为基于这样不以为然的态度能不能做到多少对数据化及其社会变化的有效判断,对于这个我提出的问题,我的观点即使不是否定的也持极大的保留态度的。不知道你以为如何。
忙忙碌碌
发表于 2015-5-3 15:16:58
大大们,歪个楼。哪里可以看到忙总啊
葡萄
发表于 2015-5-3 15:21:12
忙忙碌碌 发表于 2015-5-3 15:16 static/image/common/back.gif
大大们,歪个楼。哪里可以看到忙总啊
豆瓣
葡萄
发表于 2015-5-3 15:24:42
本帖最后由 葡萄 于 2015-5-3 18:06 编辑
守望大西瓜 发表于 2015-5-2 18:51 static/image/common/back.gif
那这样作假的意义何在?
给一个参考
前些年搞的考试分数分数上线,一开始的数据整合可以用混乱不堪来形容,但是按照特定的模型整合,时间拉长了,两三年后流程理顺,然后是过去的老套路几乎无所遁形。
不是说大数据后面不造假。只是已经有的造假方式,在大数据治理面前及时一时奏效长期也难以为继。以后肯定有新的造假方式,这个就是一猫捉老鼠游戏。
般若
发表于 2015-5-4 16:58:40
葡萄 发表于 2015-5-3 15:00 static/image/common/back.gif
你文字中所体现的状态,恰恰是很多论坛讨论中问题的集中体现。既,分不清自己提的问题是基于客观现实的推 ...
类似的股票,葡萄再给推荐一个吧。
飞机拿了两月啦,谢谢葡萄。另外一只年初翻倍打算出来了,目前不知道有什么标的。{:1_1:}
icysword
发表于 2015-5-5 13:11:51
葡萄 发表于 2015-5-3 15:24 static/image/common/back.gif
给一个参考
前些年搞的考试分数分数上线,一开始的数据整合可以用混乱不堪来形容,但是按照特定的模型 ...
赞一下葡萄大。学过数据分析基础的,应该知道相关性是如何计算出来的。大数据分析在剥离无效偏离(造假的数据就是一种)方面,有其天然的优越性。虚假数据有可能造成一时的关联性偏离,但是数据量指数增加的情况下,造假也变得不容易了。
葡萄
发表于 2015-5-5 20:45:52
icysword 发表于 2015-5-5 13:11
赞一下葡萄大。学过数据分析基础的,应该知道相关性是如何计算出来的。大数据分析在剥离无效偏离(造假的 ...
这里你可以看到不同人对大数据应用不同理解的差异。自己对我看中的大数据关键之一是改变了进化速度或者进化效率。思维方式跟不上,获得再多准确及时与有效的信息带来大多半是干扰而不是臂助。
葡萄
发表于 2015-5-5 20:45:53
icysword 发表于 2015-5-5 13:11
赞一下葡萄大。学过数据分析基础的,应该知道相关性是如何计算出来的。大数据分析在剥离无效偏离(造假的 ...
这里你可以看到不同人对大数据应用不同理解的差异。自己对我看中的大数据关键之一是改变了进化速度或者进化效率。思维方式跟不上,获得再多准确及时与有效的信息带来大多半是干扰而不是臂助。
warmanky
发表于 2015-5-7 16:23:11
IT民工飘过,时下流行的“大数据”是真正意义的大数据吗?:lol
西溪老槐
发表于 2015-5-9 17:36:51
我不吃青椒 发表于 2015-5-1 08:28 static/image/common/back.gif
老哥好:
先有数据的真实性和及时性才能有数据分析的准确性。
这里开个小差,活跃活跃老兄的高楼 ...
我不吃青椒:你好!
楼财长的言论如果是学术讨论也就算了。如果是政策制定的基础,那么,中国很快就会内乱。这种言论就是乱国之言。这不是大帽子。美国不进行农业补贴?补贴大着呢?还要利用政府力量和军事力量打开国际市场,日本与美国的商贸摩擦农业就是主要摩擦之一。美国与欧洲也同样,只要看看它们的贸易构成就行了。像楼这类离中国地气太远的人,他的话,听听就算了,不要当真。
回到学术讲城市化。有一个非常重要的理念,就是“城市病”是人与人的矛盾,还是人与自然的矛盾。是人与自然的矛盾。“城市病”是人类的这种居住形式给自然带来的压力和破坏超越了自然的自我修复能力的反应。如果一定要拉上社会因素,那么,超越自然承受能力的城市是可以给市场提供最低成本的劳动力。从马克思主义角度来说,榨取剩余价值空间比较大。
在我国,真正的城市化应该建立在“离土不离乡”的基础上的。这样的事例非常多。伴随离土不离乡农村走向,就是“集体化,机械化,电气化……”而集体化是公有制的形式之一。这样,就遇到一个意识形态上的大问题了。
真正的大数据一定是建立在社会性的基础上的。只有社会性,它才有真正的意义。一个小圈子里的自弹自唱,除非能自给自足,才能活下去。而自给自足那是倒退到什么时代了。
至于人与人之间的差异性。马克思研究得比较多,也是西方公认马克思伟大的地方。马氏认为,一个社会进步的解决方案,要从人与人之间没有平等的起跑线开始。“没有平等起跑线”,这在农村分地的时候最明显了。一家男丁多的,就比女丁多的,所分土地和继承上要优势许多。这是平等吗?那么,什么样的才是平等呢?按照西方市场经济学的观点是找不出一个平等起跑线的。所以,马氏才主张社会主义(最后发展到共产主义)。因为,在一个条件下个体的短板,在另外一个条件下可能就是长板,当人们只依据某一条件下的长短来分配资源,那么,在与人与自然的矛盾中,人类就会失败。马氏著作中用了许多篇幅来肯定资本主义比封建主义进步就是从这个视角来讲的。
不是大数据改变社会,而是人类自我改变。关键是向那里变。在资源有限的条件,社会的管理,总是依赖一部分叫精英的人们来进行的。而精英们是利他,还是利己(们)就非常重要了。利他者,眼光自然就会看到人与自然的矛盾,而利己者则只有我(们)。
抢粮,是人与自然矛盾中,人落败后的一种选择。人类的发展,是从相互相食,到相互抢粮发展到相互供粮的。回到抢粮,那是文明的倒退。
至于表彰劳模,政治诉求高于意识形态诉求。中国治理国家的理念就是紫禁城大殿上的两个字“太和”。在资本已经形成财团的条件下,如果没有社会力量的制衡,那么,这场博弈就得解体了。和不了了。那么,谁是最好的制衡主体呢?马氏说,无产阶级是资产阶级的掘墓人。
谢谢你的回复。就你展开的内容就聊一下。再次谢谢你,谢谢!
西溪老槐
发表于 2015-5-9 17:44:25
葡萄 发表于 2015-5-2 12:26 static/image/common/back.gif
对顶层设计者来说,王石潘石屹他们是中层。这个不是我臆测是他们的原话。这里很多人,对顶层设计的猜测大 ...
谢谢葡萄,希望早日看到你的心得。谢谢!
葡萄
发表于 2015-5-9 19:39:04
本帖最后由 葡萄 于 2015-5-9 19:54 编辑
rafanadal 发表于 2015-5-2 13:42 http://www.sychaguan.com/static/image/common/back.gif
忙总关于官僚体系改革有个比喻是刀子再快砍不了刀把。
但我还是无法理解现任中堂的履历,大学毕业后在 ...
弱政府才能简政放权,党管一切
2013年初,从某长老家小孩哪里知道的改革中习总李总分工的时候,我还以为我自己懂了。结果和一个体制内的朋友说起这个,他两个爷爷都是军级干部,他第一反应说: 难道说矛盾到这样的地步了么。我是在这一年后才懂他说这句话的指向。上面的事情不要猜测,做自己懂的。键盘政治局,误人误己。今天和一个茶馆网友讨论后面可能的合作安排的时候,无意中说了一些我前年知道的细节。他说如果这些细节写到论坛,论坛很多人会发疯。没其他意思,没有丝毫炫耀的意思。就是那句我只做自己看的懂(而且都是我自己以为看懂事后证明远远滞后的判断的时间节点的)的事情都觉得来不及了。其他事情没功夫操心。
葡萄
发表于 2015-5-9 19:45:51
本帖最后由 葡萄 于 2015-5-9 19:52 编辑
西溪老槐 发表于 2015-5-9 17:44 http://www.sychaguan.com/static/image/common/back.gif
谢谢葡萄,希望早日看到你的心得。谢谢!
最近买了两本书在啃,要比计划稍迟,因为我发现不仅这两本书写了我很多想法。而且表述比我专业的多关键简练的多。
1. 第二次机器革命,这个我现在和反应以第一次机器革命时代背景被蓝图的 技术与文明对照着看,
2. 0 边际成本 ,这里我对应我们自己去年推论的边际效益递增说来看。
我这里主要说的不是什么架构设计,是试图帮助更多普通人在大数据再分配圈中找到自己一席之地。我自己再07年就开始做准备工作,当时写下很多讨论在西西河,那些涉及我们当时架构的思考。我自己现在做的顺手是因为,从2012年开始搭上了自贸区开始的改革节奏以及调整了当时的布局安排。今天下午和人在做的架构是安排到2018年到2020年要实现的目标以及每一年要做到什么的实践路径,并为那之后的安排做好预留空间(比如在自己信得过且志同道合的朋友之间募集资金筹备母基金,这个是第一步)。希望能帮到更多的人。
重要的不是现在做什么而是做好规划。
守望大西瓜
发表于 2015-5-9 20:05:07
葡萄 发表于 2015-5-9 19:39 static/image/common/back.gif
弱政府才能简政放权,党管一切
2013年初,从某长老家小孩哪里知道的改革中习总李总分工的时候,我还 ...
至古以来,对官僚阶层的改革都是失败的,觉得唯一成功的一次是文革。
西溪老槐
发表于 2015-5-9 21:01:31
守望大西瓜 发表于 2015-5-2 18:03 static/image/common/back.gif
你这个假数据 是单个人作假,还是某个部门作假? 全量数据监控下,想要作假,那太蛋疼了。
守望大西瓜:你好!
你和我不吃青椒的讨论应该都涉及到了数据假的问题。这是大凡真正涉及到大数据讨论时都会遇到的。你们都说了这个问题的一面。
数据假有人为假,数据没有反映的事物本质的假,和数据在流动中异变的假。
数据人为假,随着大数据相应的技术出现,为人为假的数据提供了极大的便利,也为发现人为假提供了有利的武器。以财务报表为例。
在我学财务的时候,一份资产负债表大约可以细分为223个小项目。在电算以前,要把各个项目做平,看不出做假,还真的要有一些本事呢。做假的时候,一个小的感觉不对头,找明细帐一对,是非常容易发现企业有假。电算后,做假的水平大大提高,真的可以把报表做得滴水不漏。那些网上报税的,有那一个是漏税的。现实中真的没有吗?
进入大数据时代后,不光可以查这个企业的帐,还可以把你上下游的企业放在一起查,这样,你这个企业电算做假滴水不漏,但是,与你相关的企业却因为自负盈亏而只能保全自己的帐目滴水不漏,而不能保全与你经济往来的数据显示出你的做假。这样,税务就可以发现你的企业做假。
道高一尺,魔高一丈。你的企业把上下游统吃了,做平了假帐了呢?税务又会有新的方法。所以,做假和破假是一个不断发展手法的矛盾体。要看时势和条件。总体上讲,在破假的成本上,做假的企业集约化程度越高,破假成本越高,最后,只能博弈解体,转换成另外一种运动形式。
团体造假,还有一种形式是利用手中的权力造假,手法一是指令做假,一是控制信息分布显示做假,让分享信息的人在处理信息后得到的是不正确的结果。前者容易理解,后者相对较难一些。用一句人们批评大众传媒的话来表示:刻意删减的新闻是造谣,不全面的报道是造假。这句话的意思是说,构成新闻的素材都是真的,没有问题。问题在新闻告诉的时候,有一些真的新闻不告诉你,让你根据传播给你的新闻得出结论。这是利用人们认知过程的一些心理效应诱导人们自己得出不正确的结论。这里不展开了。
团体造假对大数据信用的破坏力非常大。一般而言,个体是没有能力验证大数据真伪的,团队验证的成本也是非常高的。个体如果要运用大数据话,只能认为它是真的。这就形成了事实上的“不对称”。一旦人们在运用大数据中损失惨重,那么,大数据也就结束了这轮使命,要等到下一轮条件成熟的时候,才能再兴起。问题是,时间,时间过去了。想在大数据上占先机的,不只是某一个人,还有某些阶层,某些区域,某些国家。
从这个意义上讲,我不吃青椒提出的团体做假是非常有意义的。刀越快,伤人快,伤己也快。
数据没有反映的事物本质的假。这与人们认识事物的能力和经验积累有关了。许多人觉得只要有大数据就能解决这个问题。这是一个误区。也是《大数据时代》这本书错误之一(也就是相关性与因果性的关系认识错误)。
自组织与熵,是一对范畴。人们是先认识自组织的,认为“一盘散沙”个体,只要发生运动就可以自发产生组织行为。所以,数据的采样,自然会把反映这种认识的对象作为数据采取。但是,这些数据反映了事物活动的全部吗?不是。只是一个侧面。对于所认识到的对象来说,它们是真实的,但是,就事物的整体来说,却是残缺的。当事物发生自组织的那一刻起,就产生了分解这种组织的过程,也就是熵。正是自组织与熵的运动,才让事物由发生发展高峰衰退消亡。所以,只有当人们认识到事物有这样一对矛盾时,才会有更好的数据采集,数据样本的确定和时间确定。在认识熵之前,事物的数的描述就存在假的成分。
大数据能校正这种过程吗?大数据不能。是人能。第一,数据是人们认识事物的一个结果。认识先,数据表达后。第二,事物暴露其本质是一个过程,人的认识是与之相应的过程。数据不可能超越事物本质暴露之前而存在。第三,事物表现其本质的内容,有些是可以用数表达效率高,有些则效率极低。那些极低的内容表达,用数据来表示,在目前来看,没有相应的技术能力是不行的(我在层贴中讲过的那个美国心理学家统计日军进攻时间的例子)。
数据在流动中异变的假。这个内容就非常多了。也不太好表述。说到什么程度就什么程度吧。没说清楚就直接提,我再补补看。
大数据,一个重要的目的是预测。预测,时点数据肯定不行的。必然是时段数据。也就是一个个时点数据以时间为序的集合。有了这样的集合的数据能不能预测呢?短期能,中期不能,长期决不能。以平滑统计预测为例,它的有效性只有三个月。过了,正确率就会大幅度下降。加权也一样。为什么预测不准?取样没有变化呀。数学公式没有变呀。原因就是数据应该反映着运动着的成分(原因是事物是运动的,发展的,数只是表达这种运动形式),在运算过程,这种运动成分被数的过程抽象了,增加或者减弱了这种运动的“比重”,反映的不是事物真正的运动过程,只是接近的运动过程。
是不是可以通过更加细化数据来避免抽象带来的问题呢。在一定程度上可以,但是,随着细化程度的增加,新的问题出现了,数据反而变得“测不准”了。这里不是讲量子力学中的波粒性。还是在牛顿物理的范畴。测量像一把刀,细化程度越高,刀锋就越利。好,当我们测量的时候,这把刀砍下去了。结果呢?如果砍的是一条数轴,我们就会发现,我们砍中无理数的机会,远大于有理数。刀越锋利,砍中无理数的概率就越高。当我们需要的是有理数的测量数据时,随着细化,却得到越来越多的无理数的内容。这就是异化了。
数据在流动中异化,涉及内容很多,说这两个例子是试图让大家理解。其实它包含的内容真的不是几个贴子能说清楚的。
守望大西瓜,借你与我不吃青椒的话题,说一下数据假的问题。谢谢你与我不吃青椒的展开和讨论。谢谢!
守望大西瓜
发表于 2015-5-9 21:33:27
西溪老槐 发表于 2015-5-9 21:01 static/image/common/back.gif
守望大西瓜:你好!
你和我不吃青椒的讨论应该都涉及到了数据假的问题。这是大凡真正涉及到大数据讨论 ...
我似乎跟你想到刚好相反,比方这段‘有了这样的集合的数据能不能预测呢?短期能,中期不能,长期决不能。’ 我自己的理解是‘有了这样的集合的数据能不能预测呢?,短期不能,中期不确定,长期能。‘
万丛山
发表于 2015-5-9 21:38:02
西溪老槐 发表于 2015-5-9 17:36 static/image/common/back.gif
我不吃青椒:你好!
楼财长的言论如果是学术讨论也就算了。如果是政策制定的基础,那么,中国很快就会 ...
您的论述太牛了。
西方的精英都是利己的,这点毫无疑问。
中国的精英,头上还有一个紧箍咒约束着他们。
楼的讲话,虽然我不懂,但是直觉觉得非常扯。一是粮食安全;二是土地问题,不经论证、试点就敢下结论?
西溪老槐
发表于 2015-5-9 22:04:38
守望大西瓜 发表于 2015-5-9 21:33 static/image/common/back.gif
我似乎跟你想到刚好相反,比方这段‘有了这样的集合的数据能不能预测呢?短期能,中期不能,长期决不能。 ...
守望大西瓜:你好!
我们相互理解可能不在一个层面。
我是讲具体的数据的应用。是讲数据预测的这个点。这个结论,不是我说的,是统计界的一个公认。我举了平滑指数预测。
你讲的应该是透过数据变化的现象,看到事物发展方向。不是具体数据的应用。应该从接近哲学的角度来看问题了。
我是这样理解你的这个回复的,如果你认为不一样,你最好举一个例子。我们一起讨论一下,如何?
谢谢你的回复,谢谢!
海因杰
发表于 2015-5-9 22:34:02
守望大西瓜 发表于 2015-5-9 20:05
至古以来,对官僚阶层的改革都是失败的,觉得唯一成功的一次是文革。
文革不是失败了?
warmbullet
发表于 2015-5-9 23:00:46
葡萄 发表于 2015-5-9 19:45 static/image/common/back.gif
最近买了两本书在啃,要比计划稍迟,因为我发现不仅这两本书写了我很多想法。而且表述比我专业的多关键 ...
对大数据目前的发展状态和以后的发展趋势始终是雾里看花的感觉,尽管我是搞IT的。惭愧ing,不想被裹挟,可是不得门路。
rafanadal
发表于 2015-5-10 10:11:05
葡萄 发表于 2015-5-9 19:39 static/image/common/back.gif
弱政府才能简政放权,党管一切
2013年初,从某长老家小孩哪里知道的改革中习总李总分工的时候,我还 ...
记得80年代一度党政分开是热词,当然现实里党政是没法楚河汉界的。从服务社会的角度说政府尤其是基层政府官本位传统依然,重新分配权力范围的话至少一方会被压缩。
我只能说李的公开简历里升迁路径非常诡异,再多的就不是我能猜测的。
被寄予厚望的新技术是否带来新的组织模式是实践问题,更好的组织应该体现出类似热兵器取代冷兵器式的压倒性优势,如此才会产生不可抗拒的变革动力。以步枪为例的话现在算是什么阶段
呢?
守望大西瓜
发表于 2015-5-10 18:52:21
西溪老槐 发表于 2015-5-9 22:04 static/image/common/back.gif
守望大西瓜:你好!
我们相互理解可能不在一个层面。
:$ 我没办法举例,也不知道怎么举。
我的理解是,大数据是要对数据进行前期的积累,然后才有对后续的预测。我为什么说短期不能,因为收集的数据太少太偏面,判断不了。中期不确定,虽然收集了足够多的数据,但是可能性太多,结果可能有十几个,长期能,大白话就是 差不多就这样了,结果无非就两三个。你应该知道两三个结果对整个社会意味着什么。
zilewang
发表于 2015-5-10 19:07:43
葡萄 发表于 2015-5-2 13:00 static/image/common/back.gif
你提的前提是有必要商榷的
我自己和朋友们反复讨论的观点之一,没有垃圾数据。回到你的话题,数据再假 ...
对流程再造,忙总的信息来源是有说服力的,他的诊断肯定是到长老一级了。李现在面临经济下行压力,搞不好要失空斩,自身又对官僚不熟悉,既无行政经验,又无行政干才,且无行政资源,要出政绩保位,还为2年后卡位,病急乱投医也是情理之中。
守望大西瓜
发表于 2015-5-10 19:19:55
海因杰 发表于 2015-5-9 22:34 static/image/common/back.gif
文革不是失败了?
:lol 整个是失败了,但对统治集团进行了大换血,而且是和平的,没有血腥的屠杀,这个就算成功。
页:
1
2
3
4
[5]
6
7
8
9
10
11
12
13
14