2012年7月出版的《大数据》是中国大数据领域第一本著作,引领了中国社会对大数据战略、数据治国和开放数据的讨论,该书先后获得
国家图书馆文津图书奖、第四届中国软科学前沿探索奖、2012年度十大好书等奖项。
2012年,时任
广东省委书记的汪洋在广东省财政厅调研时还曾向全体干部推荐《大数据》一书,称“大数据对政府部门有重要意义”。
基本介绍
中国大数据领域第一本专著,引领了中国社会对大数据战略、数据治国和开放数据的讨论。
入榜《
亚洲周刊》“年度十大好书”,获国家图书馆文津图书奖、第四届中国软科学前沿探索奖。
历史学大家、
匹兹堡大学历史系荣誉讲座教授
许倬云,有感于“老大哥”的影子,专门作序:“我们要对
涂子沛先生致敬与致谢,因为他为华文世界提出一个重要的话题。”
哈佛商学院访问教授、全球顶尖的管理咨询大师达文波特,为中国政经两界提示智库建言:“无论是对中国政府,还是就中国的商业组织而言,《大数据》都是一本重要的书。
《
罗辑思维》死磕书目,第一季17集“反腐的曙光”。
内容简介
公布官员财产
美国是怎么做的,美国能让少部人腐败起来吗,美国式上访是怎么回事,凭什么美国矿难那么少,全民医改美国做得到吗,美国总统大选有什么利器才能赢,下一轮全球洗牌我们世界工厂会被淘汰吗……
除了上帝,任何人都必须用数据来说话。
大数据浪潮,汹涌来袭,与互联网的发明一样,这绝不仅仅是
信息技术领域的革命,更是在全球范围启动透明政府、加速企业创新、引领社会变革的利器。现代管理学之父
彼得·德鲁克有言,预测未来最好的方法,就是去创造未来。而“大数据战略”,则是当下领航全球的先机。
大数据,这一世界大潮的来龙去脉如何?数据技术变革,何以能推动政府信息公开、透明和社会公正?何以促发行政管理和商业管理革新,并创造无限商机?又何以既便利又危及我们每个人的生活?
谷歌、
百度集团之类搜索服务,何以会不再有立足之地?引领世界的数据帝国——
美国和西欧,正在如何应对大数据时代?我们中国,又当如何作为?
本书通过讲述美国半个多世纪信息开放、技术创新的历史,以别开生面的经典案例——
巴拉克·奥巴马建设“前所未有的开放政府”的雄心、公共财政透明的曲折、《数据质量法》背后的隐情、全民医改法案的波澜、统一身份证的百年纠结、街头警察的创新传奇、美国矿难的悲情历史、商务智能的前世今生、数据开放运动的全球兴起,以及云计算、Facebook和
Twitter等社交媒体、Web3.0与下一代互联网的未来图景等等,为您一一细解,数据创新给公民、政府、社会带来的种种挑战和变革。
美国是全书主体,但又处处反观中国当下的现实。回望中国,
胡适批评“差不多先生”,
黄仁宇求索“数目字管理”,作者从
太平洋对面看到中美两国的差距,深知中国缺少什么、需要什么,故将十多年观察、思索所得,淘洗成这一本书。
作者简介
涂子沛,知名
信息管理专家,曾居美国硅谷,现任阿里巴巴副总裁。毕业于
华中科技大学、中山大学和
卡耐基·梅隆大学。赴美留学之前,曾在省、市、县几级政府的不同部门磨砺10年,做过职业程序员,担任过公安边防巡逻艇的指挥官,也从事过政府统计工作。在美期间,先后担任软件公司的数据仓库程序员、数据部门经理、数据中心主任、亚太事务总监、首席研究员等职务。除了工作、写作,还热心公益,曾任中国旅美科技协会匹兹堡分会主席,现任中国旅美科技协会副主席,
上海真爱梦想公益基金会理事。
著有《大数据》、《数据之巅》。
目录
■序言一 大数据:为
顾贞观世界提出一个重要话题 /
许倬云■序言二 中国的雄心应该拓展到大数据领域 /
托马斯·达文波特■ 序 幕 新总统的第一天
一人一票:把“黑”人送进“白”宫
大国新政:阳光是最好的防腐剂
■ 上 篇 帝国风云
第四股力量:知情权的起点
国会议员:孤独的战争
政府VS.社会:旧剧情重现新时代
■ 第二章 数据帝国的兴起
最小数据集:上升到立法高度的开路先锋
民意几时有:选票催生的创新
“大数据”战略:争夺全世界的下一个前沿
■ 第三章 数据治国
循“数”管理:平安大道怎样铺
数据“打”假:最大的争议就是福利滥用
CompStat :街头警察的创新传奇
■ 第四章 商务智能的前世今生
起源:从数据到知识的挑战和跨越
结蛹:数据仓库之厚积薄发
蚕动:联机分析之惊艳
■ 中 篇 法则博弈
■ 第五章 帝国的法则
收集法则:减负,为人民减负
使用法则:隐私,文明社会的共识
发布法则:免费,人民已经交税
管理法则:质量,互联网时代的根本
■ 第六章 《数据质量法》的困局
产业界“俘虏”政府:数据背后的政经战争
美式“旋转门”:权、名、利大串场
“掺沙子”法案:国会对付总统的独门秘器
环保“风险门”:公共利益常常无人代表
集体行动的逻辑:人人都想“搭便车”
三权之歧:什么是真正的“和谐”
■ 第七章 全国隐私风波
大数据就是“老大哥”:中央数据银行之争
百年纠结:统一身份证
“9·11”大拐点:以反恐的名义向左转
万维信息触角计划:追踪恐怖分子的“数据脚印”
■ 下 篇 公民故事
■ 第八章 数据开放运动
一个新的世界:从软件开源到数据开放
总统的雄心:公共财政支出透明
数据民主:印裔首席信息官的崛起
总统在见谁:大医改中的“小”插曲
全体美国人的房子:白宫
步步妥协:总统与草根的对决
从白宫安保到政治监督:执著的公民改变世界
■ 第十章 矿难中的歌声和数据
集体行动的号角:你站在哪一边
可以避免的悲剧:数据揭示的全景式真相
默认公开推定:和矿难赛跑的原则
唯一的道路:民主时时都要“争”
■ 外 篇 天下趋势
■ 视界一 大趋势
大合流: 国际开放联盟
云计算:新的航向
再造互联网:从网页相连到数据相“联”
■ 视界二 大挑战
逐鹿政坛:得数据者得天下
数据竞争:企业赢之道
下一波浪潮:从大数据到大社会
■ 尾 声 挑战中国:摘下“差不多先生”的文化标签
■ 大事记 20世纪大萧条后
美国信息开放、技术创新之路
■ 译名表 美国政府机构ABC
■ 后记 搭建“163大数据”的世界
书摘
题记
一个真正的信息社会,首先是一个公民社会。
P13
除了上帝,任何人都必须用数据来说话。
P35
很多情况下,“数据”和“信息”两个词经常替换使用。但严格的说,数据和信息这两个概念有很大的区别:数据是对信息数字化的记录,其本身并无意义;信息是指把数据放置到一定背景下,对数字进行解释、赋予意义。……但进入
信息时代之后,人们趋向把所有存储在
计算机上的信息,无论是数字还是音乐、视频,都统称为数据。
P42-43
程序和数据的关系,就好像
发动机和燃料,所有的程序,都是靠数据驱动的;数据之于程序,又好比血液之于人体,一旦血液停止流动,人就失去了生命,代码也将停止运行。数据的生命力,甚至比程序更持久。程序可以不停地升级、换代甚至退出使用,但保存数据的数据库却会继续存在,其价值很可能与日俱增、历久弥新。
P42
最小数据集是指通过收集最少的数据,最好的掌握一个研究对象所具有的特点或一件事情、一份工作所处的状态,其核心是针对被观察的对象建立一套精简实用的数据指标。
P57
得益于
计算机技术和海量数据库的发展,个人在真实世界的活动得到了前所未有的记录,这种记录的粒度很高,频度在不断增加,为社会科学的定量分析提供了极为丰富的数据。社会科学将脱下“准科学”的外衣,在21世纪全面迈进科学的殿堂。
P57
“大数据”之“大”,更多的意义在于:人类可以“分析和使用”的数据在大量增加,通过这些数据的交换、整合和分析,人类可以发现新的知识,创造新的价值,带来“大知识”、“大科技”、“大利润”和“大发展”。
P58
大数据的影响,就像4世纪之前人类发明的
显微镜一样。
P61
美国这个国家,虽然年轻,但相信数据、使用数据,却有着深厚的传统。数据被视为科学的度量、知识的来源;没有数据,无论是学术研究,还是政策制定,都寸步难行。
P69
一起交通事故的数据可能是无序的,一年的数据、一个地区的数据也看不出太多章法,但随着跨年度、跨地区的数据越来越多,群体的行为特点就会在数据上呈现一种“秩序、关联、稳定”,更多规律就会浮出水面。
P82
数据收集和数据分析必须成为基层部门的一种文化,一种管理哲学。
P100-102
图形是解决逻辑问题的视觉方法。……人的创造力不仅仅取决于逻辑思维,还取决于形象思维。
数据可视化的技术,可以通过图像在逻辑思维的基础上进一步激发人的形象思维和空间想象能力,吸引、帮助用户洞察数据之间隐藏的关系和规律。
P109
大数据时代的竞争将是知识
生产率的竞争。以发现新知识为使命的商务智能,无疑是这个时代最为瞩目的竞争利器。
P116-133
联邦政府这个庞大的数据帝国,是如何运作和管理的呢?
收集法则:减负,为人民减负
使用法则:隐私,文明社会的共识
发布法则:免费,人民已经交税
管理法则:质量,互联网时代的根本
P124
19世纪:以住宅为重心
20世纪:以人为重心
21世纪:以数据为重心
P136
早在几十年以前,政府所发布数据的质量问题就备受瞩目、广受争议。这是因为,这些数据,往往都关系到行业标准的设定。……每一项新标准的发布、老标准的调整,即使只有零点零几的变化,都可能影响一个行业的竞争、改变一个产业的布局。
P162
在
信息时代,
计算机内的每一个数据、每一片
字节,都是构成一个人隐私的血肉。信息加总和数据整合,对隐私的穿透力不仅仅是“1+1=2”的,很多时候,是大于2的。
P214
开放数据是一石三鸟,不仅服务大众,刺激经济,还调动了大众创新,为政府节省了软件开发的开支。
P239
永远不要怀疑那一小部分有思想并且持续努力的公民能够改变这个世界,事实上,人类的历史从来都是这样。
P262
掌握信息多的人,在社会竞争中处于有利地位,而信息贫乏的人,则处于不利的地位。前者向后者有偿转让信息来获取利益,无偿出让则收获善意,只有信息自由流动,各方掌握相同的信息后,彼此才能建立完全的信任。
P263
如果把信息公开仅仅解读为公众对政府一种单方面的监督,是狭隘的、片面的,信息公开也是政府的一种自我保护。可以看到,政府通过信息公开有效地获得了社会的信任。
P302-303
和其他的
生产要素相比,数据无疑有其独特的特点。例如,工业生产过程中的原材料,一般都有排他性,但数据很容易实现共享,而且使用的人越多,其价值越大;数据也不像机器、厂房,会随着使用次数的增多而贬值,相反,重复使用反而可能使它增值。此外,此数据和彼数据如果能有机地结合到一起,可能就会产生新的信息和知识,并且实现大幅增值。
P304
要做到“低成本、高效率”的运营以及决策正确,企业必须广泛推行以事实为基础的决策方法、大量使用数据分析来优化企业的各个运营环节,通过基于数据的优化和对接,把业务流程和觉得过程当中存在的每一分潜在的价值都“挤”出来,从而节约成本、战胜对手、在市场上幸存。
P307
基于数据的分析和竞争已经是零售业的常态,毫不夸张地说,零售业的竞争一定程度上已经成为一种基于数据的竞争,数据就是企业的财富和
金矿,数据分析和挖掘能力就是企业的核心竞争力。
P313
在大数据时代,基于层级的社会控制手段将不再适用,基于流程的管理方法也有很大的局限性。……数据的开放和流动,就代表着知识的开放和流动,代表着权力的开放和流动,这种开放和流动,是多中心的、水平的。在这个时代,社会的主体结构将从“分层”转向“结网”,在网状传播的力量的不断冲击下,个人的主体价值将得到前所未有的张扬,集中在政府的权力将开始分散,权力的最终流向,是社会、是大众,是一个个独立的公民个体。大数据时代正在呼唤下一波社会化的浪潮:一个更开放的社会,一个权力更分散的社会,一个网状的大社会。
P325
今天的中国,是一个人口大国、互联网大国、手机大国,但却恰恰还不是一个数据大国。
P327-329
中国缺乏的不是可供收集的数据,也不是收集数据的手段,而是收集数据的意识。……中国人数据意识的淡薄,由来已久,甚至可以称之为国民性的一部分。
P333
收集数据、使用数据、开放数据,都是大数据时代我们中国人需要一一面对的挑战。这三大挑战,没有一个不是任重道远。但这些挑战,也是我们在大数据时代彻底摘掉“差不多先生”文化标签的重大历史机遇。如果在这个数据意义凸显的时代,我们还抓不住这些历史机遇,继续漠视数据、拒绝精准、故步自封,等待我们的,还将是一个落后的100年。
P333
由于互联网的发明,“开放”已经成为人类社会一个不可逆转、不断加速的社会思潮。如
维克多·雨果所说:你可以阻挡一支入侵的军队,但你无法阻挡一种思想。在这个浩浩荡荡、不断前进的世界大潮当中,我们将发现,中国如果不跟上,我们的处境将会越来越微妙、越来越尴尬、越来越孤立。
P346
小数据只要在纵向上有一定的时间积累,在横向上有细致的记录粒度,再和其他数据整合,就能产生大的价值。从这个角度来看,大数据也可以理解为针对某个对象在时空两个维度上的“全息”数据。这种“全息”,在大数据的时代还表现为“多源”,即有多个源头在从不同方向对同一个对象进行数据记录,数据之间互相印证。
P350
在大数据的时代,开放数据的意义,不仅仅是满足公民的知情权,更在于让大数据时代最重要的生产资料、生活数据自由地流动起来,准确全面应用起来,以推动知识经济和网络经济的发展,促进中国的经济增长由粗放型向精细型转型升级。
P351
在大数据时代,公共决策最重要的依据将是系统的数据,而不是个人经验和长官意志……政府应加大数据治国的舆论宣传,将数据的知识纳入公务员的常规培训体系,力争在全社会形成“用数据来说话、用数据来管理、用数据来决策、用数据来创新”的文化氛围和时代特点。