| 伍加:新兴职业:数据科学家 |
| 送交者: 伍加 2010年03月10日07:30:58 于 [教育学术] 发送悄悄话 |
|
【科学技术(3)】
新兴职业:数据科学家 伍加,2010年3月10日 世界正在朝着数字化方向飞速发展:数字媒体、数字电话、数字社区、数字政府、电子病历、虚拟世界,等等。当世界越来越数字化时,电子信息不断增加,海量数据不断膨胀,分析和理解数据就变得越来越重要。 世界上最大的连锁零售企业沃尔玛每小时处理一百多万个客户,每小时向它的后台服务部的数据库存入2.5 petabytes 的信息,这相当于 167 个美国国会图书馆的藏书信息。沃尔玛的信息主管(Chief Information Officer)Rollin Ford 说:“我每天早晨反复问自己,我怎样才能把这些海量信息处理好、管理好、分析好?” Facebook 存有400 亿张照片,每天都有成千上万的新照片加入进去。人类基因库含有 30 亿对基因组,针对某组基因制造出“定向”药品已经进入试验阶段,它需要对基因库进行快速查询。对海量信息的处理和管理显得日益重要,因此一种新的职业“数据科学家”会应运而生。 数字化和信息爆炸会不会带来不良后果?信息太多了会让人们感到无所适从;数据无所不在时会出现信息安全的问题,那些不该公布的信息会引起不良后果。比如加 州欧克兰城市警察局办了一个网站叫做“欧克兰犯罪观察”,它把奥克兰市警察逮捕罪犯的数据全都公布出来,比如何时何地由于何种原因警察逮捕了何人,等等。根据这些历史信息,人们发现奥克兰警察从来不在星期三晚上扫黄打非,这就给做皮肉生意的犯罪分子有机可乘。当然,这只是并不普遍的疏漏而已。利弊相比,数字化和信息爆炸为人类生活带来的还是利大于弊。 数据已成为企业的原材料,以数据为中心的经济正在出现。商业智情,也称作BI(它是英文单词Business Intelligence的缩写),就是利用对大量的数据进行分析、挖掘、和综合,从而为企业决策做出有效的帮助。所以,商业智情可以算作数据科学家的工作内容之一。一些比较专业化的数据科学家也会出现,比如数据分析师、数据挖掘师、数据可视化设计师等等。 数据科学家需要有软件工程、统计学、图形学、数据挖掘等领域的知识。面对信息爆炸,面对海量数据,简单的表格(spreadsheet)工具已经过时。大多数的商业应用需要根据海量数据迅速作出决策,这就需要有对各种数据进行去粗取精、去伪存真、由此及彼、由表及里的有效分析工具,因为那些海量信息可以来自于各类报表,同时也来自于各个部门的异种数据库,还有大量的数据来自于互联网,它们有各自不同的数据格式和存取方式。简单地说,数据科学家需要具备三种能力,精通四门学科。这三种能力是:
目前,我们看到许多在这四门学科中某个学科的专才,将来更需要的是熟悉所有这四门学科知识的通才,这就是数据科学家。 伍加,2010年3月10日 http://blog.creaders.net/invictus/ |
|
![]() |
![]() |
| 实用资讯 | |
|
|
| 一周点击热帖 | 更多>> |
| 一周回复热帖 |
| 历史上的今天:回复热帖 |
| 2009: | 请教本坛学物理的大侠们,核聚变能为什 | |
| 2009: | 言真轻: 外行闲聊爱因斯坦的相对论 | |
| 2008: | 佛教与科学--佛陀与科学家 | |
| 2008: | 从FELLOW到住院医生的逆行之道 | |
| 2007: | 香港第一:閑話當年會考狀元 | |
| 2007: | ddsd:PH.D亏就亏在第一份工作都是Entr | |
| 2006: | 人类十大悲哀学科 | |
| 2006: | 哈佛校长,最令人厌烦的职位 | |
| 2005: | 正在转变的大众接收新闻方式 | |
| 2005: | 诺贝尔的遗憾 | |




