- 商家货号:T001940841
- ISBN:9787521716696
- 出版日期:2023-01-01
- 页码:0
- 字数:0
- 装帧:
- 开本:
- 版次:
编辑推荐 |
|||
|
|||
内容简介 |
|||
人工智能迅猛发展,对社会和商业的影响日益深刻。我们在过去被认为非常难以解决的问题,会因为大数据和机器智能的使用而迎刃而解,比如自动驾驶、语音识别甚至解决癌症个性化治疗的难题。同时,机器智能还会颠覆现有商业模式,很多传统的行业都将采用智能技术实现升级换代。在《智能时代》(1版)畅销百万册后,吴军博士对内容进行大幅修订,力图全景呈现机器智能的原理和发展历程,以及它们对未来产业和社会的影响本书一共分为四篇。篇一介绍大数据和机器智能的原理和基础、机器智能的发展历程及其关键的深度学习技术。篇二介绍大数据和机器智能所带来的思维革命。篇三介绍智能革命自身的技术挑战和机遇。篇四介绍智能革命对产业、社会以及对个人所带来的机会和冲击。随着IoT、5G通信的发展,以及区块链与机器智能的紧密结合,整个社会的智能水平将达到靠前的高度,人类将步入超级智能时代。因此,每个人都要未雨绸缪,力争做控制世界的那2%,而不是被智能化浪潮淘汰。
|
|||
作者简介 |
|||
|
|||
目录 |
|||
推荐序一大数据与机器智能催生智能时代 /邬贺铨
|
|||
精彩书评 | |||
|
|||
书摘 |
|||
在很多人的印象中,数据就是数字,或者必须是由数字构成的。其实不然,数据的范畴比数字要大得多。互联网上的任何内容,比如文字、图片和视频是数据;医院里包括医学影像在内的所有档案是数据;公司和工厂里的各种设计图纸是数据;出土文物上的文字、图示,甚至它们的尺寸、材料,都是数据;甚至宇宙在形成过程中也留下了许多数据,比如宇宙中的基本粒子数量。虽然数据本身是客观存在的,但是它的范畴是随着文明的进程不断变化和扩大的。 数据、信息和知识 在计算机出现之前,一般书籍上的文字内容并不被看成是数据,而今天,这种以语言和文字形式存在的内容是全世界各种信息处理中最重要的数据,也是全世界通信领域和信息科技产业的核心数据——包括我们的信件、电话和电子邮件内容,电视和广播节目,互联网网页,以及各种社交产品中由用户产生的内容(user generatedcontent,简称UGC)。这些数据的共同特点是以语音和文字为载体。因此,研究人员为了更好地研究和处理它们,还建立了专门针对语音和文字的数据库,即所谓的语料库(Corpus)。在语料库中,数据主要是语音和文字的内容,反而没有多少数字的内容。 将数据的外延再扩大,那些医学影像资料、工业中的各种设计图纸都可以被划分为数据,事实上,它们已经是今天大数据处理的对象了。我们人类的活动本身,也可以被看成是一种特殊的数据,比如我们玩游戏的行为,我们的社会关系,我们每天的活动,等等。可以想象,我们的下一代所谈论的数据,一定比今天的范围更广泛。可以说,数据是文明的基石,人类对它的认识也反映了文明的程度。 人们在谈论数据时,常常把它和信息的概念混同起来,比如在谈论数据处理和信息处理时,其实人们想要表达的意思相差不大。然而严格地讲,数据和信息虽然有相通之处,但还是不同的。 信息是关于世界、人和事的描述,它比数据来得抽象。信息既可以是我们人类创造的,比如两个人的语音通话记录,也可以是天然存在的客观事实,比如地球的面积和质量。不过信息有时藏在事物的背后,需要挖掘和测量才能得到,比如宇宙大爆炸时留下的证据——3K背景辐射、物理学定律中的参数、日月星辰运行的周期等。在西方很多物理学家看来,上帝在创造宇宙时,将很多信息埋藏在了黑暗之中,他们的工作就是找到这些信息,并且用数据把它们描述清楚。因此,在这种前提下,将信息和数据混为一谈倒也无害。 不过,数据和信息还是稍有不同。虽然数据优选的作用在于承载信息,但是并非所有的数据都承载了有意义的信息。数据本身是人造物,因此它们可以被随意制造,甚至可以被伪造。没有信息的数据通常没有太大意义,人们也不太关心,因此这些数据不是本书想要讨论的重点。伪造出的数据则有副作用,比如我在《数学之美》中不断提到的为了优化网页搜索排名而人为制造出来的各种作弊数据。另外,我们还需要强调,那些有用的数据、毫无意义的数据和伪造的数据常常是混在一起的,后面两种数据无疑会干扰我们从数据中获取有用的信息。因此,如何处理数据,过滤掉没有用的噪声和删除有害的数据,从而获取数据背后的信息,就成为一门技术甚至是一种艺术。只有善用数据,我们才能够得到意想不到的惊喜,即数据背后的信息。我们不妨看一个如何通过数据得到信息的例子(见图1—2)。 P5-8
|
商品评价
100%好评
共有0人参与评分评价商品