雲計算 – Page 233 – 小科科的春天

基于注意力机制优化的生成式文档摘要模型

click / 2019-11-06

本文收录于EMNLP 2019，oral 短文。背景在互联网时代，各个领域场景产生越来越多的文本数据，文本摘要作为文本“降维”处理的重要手段，旨在将文本或者文本集合转换成包含关键信息的简短摘要。该任务方法主要分为两大类：抽取式摘要和生成式摘要。抽取式摘要方法从源文档中抽取关键句或者关键词组成摘要，摘要内容全部来自原文，这种方法比较简单直接，但是做法和人类总结概括文章的方法技巧相差甚远，同时也面临coherence等问题。随着sequence2sequence模型的出现和发展，生成式摘要模型相关研究也吸引了众多学者的目光。生成式摘要模型顾名思义，就是从源文档生成摘要，摘要中的词可能在原文中并不存在。这一大类方法更接近于人类的摘要方法，得到的摘要一般较为通顺，但是也存在诸多问题，如repetition、saliency、incorrect fact等。当然文本生成任务本身就具有较大难度，我们期待未来有一天计算机能够像人类一样会写作表达，可以写出高质量的自然语言文本。本文聚焦于优化摘要模型中的注意力机制，注意力机制最早是应用于图像领域，大概是九几年就提出来的思想。在2014年，Google Mind团队发表的《Recurrent Models of Visual Attention》[1]一文使得注意力机制开始火了起来，该论文提出在RNN模型上使用Attention机制来进行图像分类，结果取得了很好的性能。随后，在Bahdanau等人发表论文《Neural Machine Translation by Jointly Learning to Align and […]

雲計算

EMNLP 2019 精彩会议论文解读大全

click / 2019-11-06

EMNLP 自然语言处理实证方法会议（Conferenceon Empirical Methods in Natural Language Processing）由ACL当中对语言数据和经验方法有特殊兴趣的团体主办，始于1996年。2019年EMNLP会议于11月3日到7日于香港亚洲世博会举办。以下是本场会议的精彩论文解读，欢迎收藏！一、面向任务型对话的异构记忆网络摘要：人类通过语言将大脑里的知识表达出来，通过对话相互传递知识。机器通过学习大量的语料可以一定程度学会流畅的语句表达，但如果没有知识，则生成的只会是漂亮而无内涵的回复。传统的模块化的对话模型可以通过数据库查询等方式将关键信息填入回答的模版中，但是端到端的对话生成模型则要更复杂一些。为了解决这个问题，记忆网络（Memory Networks）通常是一个不错的技术方法。但是现有的记忆网络结合对话系统只是提供了如何引入知识的一个方法，并不能很好的处理多种来源和结构的知识。因此在这篇文章中，我们提出了一个异构记忆网络（Heterogeneous Memory Networks, HMNs）来同步处理用户语句，对话历史以及背景知识库。 HMNs由上下文无关（context-free memory）记忆网络和我们提出的上下文敏感（context-aware memory）记忆网络组成，分别用于编码、储存结构化的知识元组（knolwdge tuples）和序列化的用户语句、历史对话，并生成两个小词表分布（知识词表和历史对话词表）以及一个大词表（所有训练的词汇分布）供回复语句生成的选词。在三个数据集上的实验结果表明，HMNs超过了现有的SOTA模型，能够较显著的提高端到端任务型对话模型的表现。》》查看详情

雲計算

带你读《C指针原理揭秘：基于底层实现机制》之二：C语言快速入门

click / 2019-11-06

点击查看第一章点击查看第三章第2章 C语言快速入门 2.1　C语言的语法特点 C语言是一门语法精简的语言，它的关键字仅有32个，C语言以main函数为主函数，程序编译运行之后，执行的就是main函数的内容，因此，纵观C语言的很多程序，就会发现它们形成了一道有趣的风景线：头文件和C代码文件以main函数为中心构造，在main函数中调用这些文件中编写的代码，引用头文件。C语言程序实质上就是在程序中调用 C标准库提供的函数、其他C库提供的函数、操作系统提供的API接口、自己定义的函数，同时应用适当的数据结构和算法来完成工作。C语言主要包含如下关键字。 auto：声明自动变量。 short：声明短整型变量或函数。 int：声明整型变量或函数。 long：声明长整型变量或函数。 float：声明浮点型变量或函数。 double：声明双精度变量或函数。 char：声明字符型变量或函数。 struct：声明结构体变量或函数。 union：声明共用数据类型。 enum：声明枚举类型。 typedef：用以为数据类型取别名。 const：声明只读变量。 unsigned：声明无符号类型变量或函数。

雲計算

阿里巴巴叶军：政企数字化转型，现在是最重要的时机

click / 2019-11-06

近日，在乌镇召开的第六届世界互联网大会现场，浙江省政府与阿里巴巴集团合作开发的政务钉钉首次正式发布。随着政务钉钉的正式亮相，政务钉钉事业部总经理叶军与他带领的团队也逐步走进大众视野。政务钉钉如何帮助政府做数字化？阿里巴巴自身又是如何做企业管理数字化的？带着这些疑问，我们邀请到了叶军，从他与他的“组织中台”故事说起。（政务钉钉事业部&企业智能事业部总经理叶军）【阿里第一位计算机博士生】 1999年8月，还在四川大学读本科时的叶军，就跟4-5位在校同学一起搭建了一个名叫“川大望江楼”的网站，并启动了HOMEFACE项目。这是一个类似于facebook的校园网站，有聊天室、音乐、电影、软件、书院等不同板块，深受大学生们的喜爱。据介绍，在那个计算机网络尚未普及的年代，川大望江楼的日均访问量UV就过万了，并且成为了教育网知名网站。（川大望江楼界面）大学毕业后，叶军选择继续留校深造，直到2007年博士毕业，叶军带着对互联网计算机扎实的理论知识与丰富的实践经验，加入阿里巴巴，成为阿里第一位计算机系的应届博士生。在阿里十余年里，叶军先后任职多个部门，但在叶军看来，阿里期间他主要做了两件事：一是做企业营销相关的技术服务工作；二是做阿里内部企业管理与组织管理的数字化转型。刚进公司时的他在阿里软件事业部，围绕toB中小企业做进销存与CRM系统。此时叶军负责阿里旺旺统一登陆和企业开放平台的架构设计，后来这一平台融入了淘宝开放平台体系。随后，叶军还先后加入到速卖通、ICBU技术部等部门，分别孵化与支持了Aliexpress无线App、“信宝”业务技术。其中“信宝”作为企业级的信用交易服务，把B2B黄页网站带入了交易时代。在这些部门叶军支持了很多企业营销相关的技术工作，同时也让他看到了企业在“交易”背后，企业本身信息化、数字化发展的重要性。有了这个念头后，叶军来到企业智能事业部，带领部门着手阿里内部的企业管理数字化转型。（叶军在企业智能事业部员工大会上讲话）【组织中台：阿里的企业管理数字化转型】叶军认为，数字经济时代，面对激烈的商业竞争，企业最为关注的一点就是如何获得持续且高质量的增长，这背后比拼的最重要因素还是组织内部的协同效率。一家有竞争力的企业，一方面有能力管理好客户，另一方面，需要有能力管理好组织、员工。同时他也发现，随着阿里巴巴的业务环境变化，投资并购生态公司的不断出现与融入；公司组织协同模式从原来金字塔向扁平化、网状协同发展。组织内部的协同效率并不仅仅是研发一个系统，让线上比线下节省多少时间和成本的问题。负责阿里集团组织内部协同办公与运营管理的部门正是企业智能事业部。这些工作说起来好像容易，但叶军通过系统梳理后才发现，这个部门为阿里巴巴人、财、法、事、物、场和协同办公等核心职能，研发和沉淀了超百款产品，业务专业性，服务定制化和系统模型架构的复杂性超乎想象。随之而来的是更加严峻的挑战：如何打通这些系统。当时，在阿里巴巴的中台战略下，整个集团的运营数据能力、产品技术能力进行整合，对各前台业务进行强力支撑。阿里业务与技术中台打通。企业组织层面的系统打通迫在眉睫。 “最初，这些系统就像一个个SaaS软件一样，只能在其特定的领域服务，无法承载大中型企业的数字化管理，更无法为更多经济体企业提供规模化的服务。“叶军看到，现在组织的协同效率拼的是数字化、智能化。 “有句老话叫‘上ERP，找死；不上ERP，等死’。在一家企业中，买一个财务系统很容易，买一个采购系统也很容易，难的是把财务和采购系统连接起来。”叶军表示，“数字经济越来越成为整个经济形态的强大推动力，企业生产经营的数字化转型、企业管理数字化转型，现在都是最重要的时机。”“人、财、法、事、物、场应该是一体化的服务提供者。要建立一体化的服务提供，必须把底层的信息孤岛连接起来。我们建设完整的中台基础能力，就能把这些信息连接起来，并且在此基础上支持企业智能决策。”叶军是这样描述他心中的“组织中台”。为此，他牵头打通阿里巴巴企业人、财、法管理运营和协同系统，带领团队做了三件事：1、打通系统主数据；2、在各领域落地中台化标准；3、统一技术并提升交付能力。从此开始从0到1打造组织中台。打通系统主数据，就是把阿里巴巴经济体组织多环境下的人事、财务、空间等核心主数据打通，从而让系统能真正连接、协同起来。

雲計算

双11黑科技大揭秘，护航企业创造商业奇迹

click / 2019-11-06

随着“ 双十一“全民购物狂欢节的到来，很多企业和电商公司也将迎来流量和营业额的高峰。但是，纵观往期双十一的交易数据，我们不难发现，双十一为商家带来流量曝光和推广的同时，高频度流量也对企业数据库处理等能力提出了更高的要求。企业本身如果不能保障流畅运行和企业内沟通效率，将会对企业造成巨大的经济损失。本次解决方案专场将选取以往双十一期间出现频率较高的一些问题（如:大促流量高峰无法应对、数据意外丢失，无法及时恢复、获客难，会员营销如何更智能及企业内部沟通如何更安全更高效等）提出切实可行的解决方案，为大家分享阿里巴巴实践经验及产品化解决方案，助力企业更好的降本增效，为双十一期间爆炸式的支付交易量提供保障。解决方案双十一专场：https://www.aliyun.com/solution/collection/1111 一、数据库灾备解决方案 1. 云时代，灾备建设的契机正如投资理财，为分散风险把鸡蛋分散在不同的篮子里。业务上，为了保障服务连续性，我们也需要针对核心业务建设数据冗余灾备。针对容灾课题，国家正式出台了灾难恢复等级定义。除了测试业务外，所有的线上业务都需要构建数据灾备。其中，一般业务需要实现等级三的灾备能力，灾备的RPO/RTO为天级别；重要业务需要实现等级四的灾备能力，RPO/RTO为小时级别；对于关键业务，要求发生故障时，不能丢失超过30分钟的数据，且要在1小时内恢复业务；而对于核心业务则要做到故障时，“0”数据丢失，且在分钟级别恢复整个业务。对于企业来说，要投资建设满足国标要求的灾备系统，存在如下的痛点： 2.云时代，新容灾技术方案随着云计算的发展，企业容灾体系已迎来新的技术趋势：阿里云已上线了系列数据库容灾产品。包括数据传输服务DTS及数据库备份DBS。数据库备份DBS是为企业提供连续数据保护、低成本的数据备份服务。DBS基于实时监听及备份数据库事务日志，可实现秒级RPO的备份能力。DBS支持备份集在线查询，有效保障备份集的可用性。同时，DBS基于压缩加密及备份集生命周期管理能力，极大降低备份集的存储成本。借助DBS，企业可轻松实现云备份、跨云备份、异地备份及云下备份等业务场景。阿里云数据传输服务DTS，支持关系型数据库、NoSQL、大数据(OLAP)等数据源间的数据传输。它是一种集数据迁移、数据订阅及数据实时同步于一体的数据传输服务。企业可以借助DTS实现业务零停机上云、异地灾备、异地多活及数据仓库数据实时导入等业务诉求。目前DTS支持多达18种数据源，已服务40万+数据库实例。借助DTS,企业可以建设秒级RPO/秒级RTO的热备中心。当业务出现故障的时，可以秒级切换到热备中心。除了热备场景，DTS还可以帮助企业快速构建异地多活，异地多个业务中心互为备份，所有中心的数据保持一致，任意一个中心出现异常，业务可秒级切换到其他中心，有效保障服务连续性。 3.阿里云一站式数据库容灾方案为了降低企业管理成本，阿里云还推出数据管理DMS及混合云数据库管理HDM。借助DMS+HDM可实现数据库安全研发及性能诊断优化。立刻咨询，了解更多：https://page.aliyun.com/form/act577891419/index.htm更多故事访问：https://www.aliyun.com/solution/collection/1111 二、双中台会员营销解决方案 1.解密中台战略：双中台+会员营销=？2015年底，阿里巴巴集团对外宣布启动中台战略。经过3年多的时间，越来越多的企业利用中台战略进行企业改革，中台化被广泛普及。而就在7月份的2019年阿里云峰会·上海峰会，阿里巴巴集团CTO、阿里云智能总裁张建锋向外界隆重宣布了阿里巴巴的双中台能力。利用统一协同的“数据中台+业务中台”双中台体系，可以实现从业务生产数据，到数据赋能业务的企业闭环管理。双中台可以全面赋能企业的供应链、销售、会员等核心业务。今天，就让我们围绕大多数企业最关心的会员业务，来简单聊一聊“双中台+会员营销”。 2.什么是会员营销？（1）传统零售行业“渠道多、门店多”，业态分散，对会员的分析缺少完整的用户、标签画像，犹如“盲人摸象”（2）通过传统的代码方式来进行会员经营，耗时长、见效慢、成本高、效率低、（3）随着线上线下获客成本不断上升，流量、坪效、用户转化率不断下降（4）随着互联网服务的繁荣，会员权益也呈现出生态化的趋势，简单的优惠券、积分已经无法满足给用户提供良好的体验以上这些，是大多数企业在会员营销上遇到的困难。会员营销方案努力打破企业与会员之间的隔阂，在营销模式的演进中，帮助传统企业能够演化形成“更稳固的用户粘性——更丰富的消费者数据——更精准的营销策划能力”的效应。 3.双中台+会员营销=？在阿里云资源和企业数字化平台（Dice）之上，构建基于双中台架构的企业会员营销方案，这便是由阿里巴巴联合端点科技在本次上海峰会上隆重推出的“基于双中台的会员营销解决方案”。

雲計算

阿里云富士康发布“淘富成真” 为创业者提供硬件、电商、云计算能力

click / 2019-11-06

在10月14日举办的2015杭州云栖大会上，阿里云计算总裁胡晓明和富士康科技集团副总裁陈振国共同发布“淘富成真”项目，为智能硬件创业者赋能。鸿海精密集团董事长郭台铭为“淘富成真”题词：“不做价格的破坏者，成为价值的创造者；打造高贵不贵的产品，成就中国好智造。” “淘富成真”由阿里云和富士康共同发起，开放富士康世界级的设计、研发、专利、供应链、智造等能力，阿里云的云计算平台和大数据处理能力，阿里电商天猫淘宝的平台能力，同时引入银杏谷资本、云锋基金、猪八戒网、洛可可等企业为创业者提供全链路创新创业服务，目的是帮助中小智能硬件的创业者迅速对标国际一流品质，做出优秀的智能产品。据介绍，富士康旗下九大次集团和八大智造平台，以及数千名富士康工程师已全面入驻云栖小镇，为创业者提供知识产权保护、检验检测、工业设计、生产制造等全链条服务，并与创业者无缝对接。富士康九大次集团产品线涵盖了手机与可穿戴设备、平板电脑、车联网与传感器、笔记本电脑、电视家电、服务器、通讯与智能家庭、精密连接器、医疗健康等领域；八大智造平台为专利平台、投资平台、物流平台、跨境电商平台、检验与测试平台、快速打样（NPI）平台、智造平台、供应链与采购平台。今年年初以来，“淘富成真”项目组每周都会举办创业者见面会，来自全国各地致力于在智能硬件领域创业团队依次展示自己的产品与实力，并和阿里、富士康、银杏谷等公司代表一起探讨合作可能性。例如，一家为儿童生产防近视智能笔的创业公司入驻云栖小镇“淘富成真”后，富士康B次集团（苹果产品的生产线）将国际顶尖大厂的设计以IIDM（Integration Innovation Design Manufacture）模式从关键零组件、科技整合到设计的完整服务提供给这家公司，帮助他们重新打造智能防近视笔。针对使用者最敏感笔的重量问题，富士康帮助减重20%并缩短笔的尺寸6mm，再配合材料改良，更适合小朋友长时间使用，使产品具备了迈向国际市场的能力。阿里巴巴集团CTO王坚表示，就制造业而言，苹果对富士康看透程度远远超过中国任何一家企业。如果把富士康的能力开放出来，就可以提升整体的创新水平。阿里也开放一切和互联网相关的服务比如云计算、智能操作系统以及电子商务、支付等等。此外，创业者们还可以获得来自银杏谷资本的资金扶持、猪八戒网创意营销、洛可可的工业设计能力等等，这些都是创业创新过程中不可或缺的能力。

雲計算

30万“被消失”的视障用户，如何在淘宝剁手盖楼？

click / 2019-11-05

“做任务得喵币、用喵币升级喵铺领红包、瓜分20亿红包⋯⋯”盲人小沈用三根手指在手机淘宝的页面滑过，手机扬声器以相当于正常语速三四倍的速度读出了页面内容。被一些人吐槽“玩法复杂”的组队盖楼分红包游戏，在小沈的指尖却是一次愉悦的体验。虽然眼睛看不到天猫双11全民狂欢的场景，但双11却真实地从小沈的指尖传至心间。无障碍体验持续改善的背后，是阿里持续打造公平普惠营商环境的努力：公平良性的竞争让商家有更好的成长机会，获利发展的商家才能有力量给全社会提供更多元的服务；不断提升安全能力让红包补贴能够真正到达消费者手中而不是被羊毛党薅走。平台持续优化升级基础设施，在经营者和消费者两端保障“安心卖、放心买”，成为30万盲人主动选择淘宝天猫平台的重要原因。从无障碍购物到用耳朵抢红包 14岁那年，和淘宝的第一次亲密接触，在小沈漆黑的内心世界打开了一扇窗。今年22岁的小沈从小失明，现在是浙江特殊教育职业学院的一名学生。自2011年开始，从吃的零食，到穿的衣服，再到日常用的洗衣液，他都在淘宝购买。（图说：借助手机旁白功能，视障者用耳朵购物。）这几天，他收到朋友转发的双11“组队盖楼大挑战”邀约，加入了一个“天猫盖楼组队群”。群里面共有36个人，都是小沈以前参加公益活动时认识的大学生朋友。一开始，每当有人发喵币链接，小沈就会点进去，帮他们助力。熟悉玩法后，他每天打开手机淘宝，除了领喵币、升级、领红包“一波操作猛如虎”，组队盖楼挑战其他团队也成为小沈的“必修课”。小沈最近一次的战绩是，团队挑战成功，瓜分了一个几十元的红包。“我不在乎输赢，也不是为了红包，主要是它能让我们这些视障人群平等地参与这些互动游戏，我很享受这个过程。”小沈说。小沈能够参与互动游戏领取红包，得益于今年天猫双11对“盲道”的升级。在推出“组队盖楼大挑战瓜分20亿红包”的游戏后，阿里新零售技术团队、淘宝无障碍实验室的工程师们专门对手机淘宝的无障碍功能进行改造，在实现无障碍购物的基础上，让盲人朋友首次可以用手机在双11参加互动体验，得到更多实惠。 “视障人群也有公平获取信息，参与平台互动的权利，我们升级‘盲道’，是让这一群体享受科技带来的乐趣，有更多参与感。”阿里巴巴新零售技术事业群高级技术专家斯肯说。千余风险模型保障“盲道”安全平等参与，只是天猫双11“盲道”功能不断进化的一部分。淘宝的无障碍改造于2011年启动，成立了无障碍实验室，此后这项工作一直在持续迭代更新。（图说：淘宝无障碍实验室工程师闭着眼睛做无障碍测试。）去年，淘宝推出读光“OCR”（（光学字符识别）技术，帮助视障用户将商品详情中的图片转化成文字，进而被读出。双12期间，其日均调用量达1亿次。不论是小沈每天都要打开的“组队盖楼大挑战”游戏，还是每一个商品详情的图片内容，都连结着一颗拥有 1000 多个风险算法模型的“风控大脑”。今年天猫双11

雲計算

阿里巴巴叶军：从0到1打造组织中台

click / 2019-11-05

雲計算

[转]上海浦东：开放政府公共数据支持合作高校科研攻关

click / 2019-11-05

　　近日，上海市浦东新区人民政府与同济大学签署战略合作框架协议，浦东将开放政府公共数据资源支撑同济大学科研攻关，其中就包括高精度三维地图和管道、管线数据等。这也是高校科教优势资源与地方经济社会建设有机融合的积极探索。　　据了解，浦东新区与同济大学将开启在政产学研各个领域的全面合作，其中人工智能更是合作焦点。今年6月，依托同济大学建设的上海自主智能无人系统科学中心入驻张江人工智能岛。该中心将立足人工智能重大前沿科学难题，强化多学科跨界融合，瞄准人机协同、群智开放、自主操控等关键技术展开科研攻关，建设若干个大科学设施和研发平台，力争在自主智能无人系统等领域取得一批原创成果和核心技术，着力推动智慧城市、智能制造、智能医疗等领域的产业变革。　　为了加快高校在人工智能技术攻关及产业应用中的进度，浦东新区从5G信息基础设施、数据资源、应用场景多个维度为科研提供完整支撑。其中就包括选取前滩区域和世纪大道地铁站的地下空间，为地下基础设施全息感知和智能诊断等研究提供试验场景;共享政府内部的高精度三维地图和管道、管线数据等，用于智能巡检机器人及自动驾驶等技术研发;优先在试验区域部署5G网络，完善物联网基础设施，满足科研项目对低时延、高通量传输能力的需要等。　　此外，高校科研成果也将在浦东获得最畅通的转化通道。浦东新区近年来重点打通了科研成果转化过程中的堵点难点，一方面通过中国(浦东)知识产权保护中心，加速相关知识产权(专利)审查的效率，另一方面浦东创新“产业+基地+基金”联动发展模式，吸引各类社会资本，进一步促进优质成果高效转化。针对科研人员最关心的落户问题，浦东也将利用国内人才引进直接落户审批权和留学人员落户审批权等，全力保障核心科研人员和创新人才落得下、留得住。转字创头条，原文链接：http://www.ctoutiao.com/2410900.html

雲計算

带你读《金融科技：人工智能与机器学习卷》之二：智能金融：人工智能与金融深度融合

click / 2019-11-05

点击查看第一章点击查看第三章第2章智能金融：人工智能与金融深度融合金融与科技的结合贯穿整个金融业的发展过程，尤其是20世纪下半叶，科技进步的加快也推动了金融与科技的深度结合。可以说，在过去半个多世纪的时间里，每一次新的技术突破的出现，金融业都是率先应用新技术的领域之一。如图2-1所示，无论是ATM机还是智能卡，再到电子支付、POS终端，最后到最近的网上银行、移动银行，金融始终在应用新技术方面走在前列。进入21世纪，互联网技术的发展推动了互联网金融的出现，同时也催生了大数据、云计算、人工智能等新技术的出现，如果说互联网金融是互联网对金融业务模式的浅层次改变的话，那么大数据、云计算和人工智能，甚至区块链技术的应用则将互联网金融推向金融科技，对金融业带来深层次的变革。随着人工智能应用的深入，金融科技又开始向以人工智能应用为代表的智能金融发展，并引领金融业向数据化、自动化和智能化迈进。人工智能的发展历程如图2-2所示，人工智能的发展历史也经历了起伏波折，从1956年达特茅斯会议到现在大致经历了三次人工智能发展浪潮。第一次全球人工智能发展浪潮始于1956年的达特矛斯会议，此次会议由麦卡锡、明斯基、罗彻斯特和香农发起，这次会议的举办标志着人工智能学科的诞生。从1956年到1974年，全球人工智能领域迎来第一波发展浪潮，出现了很多世界级的算法发明，其中增强学习的雏形（即贝尔曼公式），就是谷歌AlphaGo算法的核心内容。此后，在1974年至1980年人工智能经历了第一次寒冬，人工智能的数学模型和数学手段存在一定缺陷，并且当时的计算能力无法完成所需要的计算任务。进入20世纪80年代，卡内基·梅隆大学为DEC公司制造出了专家系统（1980），可以帮助DEC公司每年节约4000万美元，特别是在决策方面能提供有价值的内容，这也促使日本和美国再次投入巨资开发所谓的人工智能计算机。这期间，人工智能数学模型方面出现了很多重大发明，包括多层神经网络和BP反向传播算法等。1987年，苹果和IBM生产的台式机性能不断提升，计算机开始进入个人家庭，且费用远远低于专家系统所使用的Symbolics和Lisp等机器，导致人工智能出现了第二波发展低潮。从1993年到现在近25年的发展过程中，人工智能迎来了第三次发展高潮，这一阶段中计算机的发展、互联网的普及使人工智能芯片、模型和数据都出现了飞跃和提升，人工智能进入一个前所未有的繁荣期，并出现了许多人工智能历史上的里程碑事件。1997年5月，IBM开发的深蓝战胜了国际象棋世界冠军卡斯帕罗夫；2005年，斯坦福开发的一台机器人成功自动行驶131英里，赢得DARPA挑战大赛头奖；2007年，Siri研发成功，后被苹果收购应用在iOS中；2010年，谷歌研发的无人驾驶汽车面世；2011年，IBM沃森系统（如图2-3所示）参加《危险边缘》节目打败人类选手；2016年3月和2017年5月，AlphaGo连续打败围棋世界冠军李世石和柯洁。人工智能之所以能够取得现在的成就，其核心在于深度学习的发展。深度学习使得机器学习能够实现众多的应用，并拓展了人工智能的领域范围。谷歌最杰出的工程师杰夫·迪恩说：“我认为过去5年，最重大的突破应该是对于深度学习的使用。这项技术目前已经成功地被应用到许多场景中，从语音识别到图像识别，再到语言理解。而且有意思的是，目前我们还没有看到有什么是深度学习做不了的。希望在未来我们能看到更多更有影响力的技术。”人工智能、机器学习、深度学习的隶属关系如图2-4所示。到现在，我们可以看到人工智能已经应用到很多领域，金融、贸易、政府、法律、物流、电商等行业都可以看到人工智能的应用，比如医疗行业的医疗影像识别、精准医疗、辅助诊断及药物研发，汽车行业的辅助驾驶，金融领域的量化投资、智能投顾、风险管理（这些是金融业中与数据分析关联性较大且依赖度较强的细分领域）等。在未来我们将看到人工智能所影响的领域和行业会越来越多，人工智能会对人类社会的经济、政治、法律、伦理等各个方面产生深远的影响。中国各个产业的人工智能应用情况如表2-1所示。金融领域中的人工智能关键技术在金融领域应用中，人工智能主要包括5个关键技术：机器学习、生物识别、自然语言处理、语音技术以及知识图谱，如图2-5所示。这5种人工智能关键技术广泛应用于金融领域的各个业务环节，在提高效率、降低成本、防控风险、促进普惠金融方面发挥了重要作用。机器学习机器学习具有多种衍生方法，包括监督学习、无监督学习、深度学习和强化学习等。在监督学习中，算法可以使用一些包含有标签的“训练”数据。比如，一个交易数据集可能包含一些在欺诈和非欺诈数据点进行标注的标签。算法就会“学会”分类的通用规则，并且可以用这些规则来对数据集中其余数据进行预测，并进行标注。无监督学习是指数据提供给算法时没有任何标注的情况。算法会被要求去识别数据中隐藏的规律。比如，一个无监督机器学习算法会被要求去寻找一些和难以定价的非流动证券具有类似特征的证券。如果算法发现了一组非流动证券簇，那么簇中其他证券的定价模式可以用于对非流动证券进行定价。强化学习介于监督学习和无监督学习之间。在这种情况下，这种算法会被输入无标注的数据集，为每一个数据点选择一个行为，并获得可以帮助算法学习的反馈（可能来自人类）。比如，强化学习可以用于机器人、博弈理论和无人驾驶汽车。深度学习是一种机器学习，根据人脑结构和功能特点设计出“层”，深度学习使用的算法就在这些“层”上发挥作用。深度学习算法，其结构也被称为人工神经元网络，可以用于监督学习、无监督学习或强化学习。生物识别生物识别技术（biometrics，也称生物测定学）是指用数理统计方法对生物进行分析，现在多指根据生物体（一般特指人）本身的生物特征来区分生物体个体的计算机技术。研究领域主要包括语音、脸、指纹、手掌纹、虹膜、视网膜、体形、个人习惯（例如敲击键盘的力度和频率、签字）等，相应的识别技术有说话人识别、人脸识别、指纹识别、掌纹识别、虹膜识别、视网膜识别、体形识别、键盘敲击识别、签字识别等。指纹识别、人脸识别、虹膜识别和指静脉识别是金融行业应用范围较广的4项生物识别技术。指纹识别技术涉及指纹样本采集、存储以及OCR技术，通过摄像头提取指纹后经过指纹识别算法完成身份识别认证；人脸识别过程主要包括获取人脸图像、进行特征提取、根据特征进行决策分类、完成匹配识别；虹膜识别采用红外成像技术，将虹膜纹络特征输入计算机，成为可供自动识别的人体身份证；指静脉识别通过指静脉识别仪取得个人手指静脉分布图，将特征值存储，然后进行匹配，进行个人身份鉴定的技术。目前，以上生物识别技术应用于客户身份验证、远程开户、无卡取款、刷脸支付、金库管理和网络借贷等金融场景。自然语言处理自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理在金融领域有着广泛的应用，多数金融行业的信息为文本形式，比如新闻公告、年报、研究报告。通过用自然语言处理和知识图谱，大大提升了获取数据、数据清洗、深度加工的效率。目前在智能投研领域中，自然语言处理技术可对海量复杂的企业信息进行处理，以提取出行业分析人员最关注的数据指标，并进行投资分析总结，最大化减少不必要的重复人力劳动，帮助分析人员进行投资决策。在智能客服领域，可以利用自然语言处理技术让智能客服理解客户需求，通过与知识库的对接为客户解决问题。语音技术在金融领域应用中，语音识别通常与语音合成技术结合在一起，提供一个基于语音的自然流畅的人机交互方法。语音识别整个过程包含语音信号处理、静音切除、声学特征提取、模式匹配等多个环节。其应用遍布各大银行及证券公司的电话银行、信用卡中心、委托交易、自助缴费、充值等各项业务，以及语音导航、业务咨询、投诉申报、账户查询、政策咨询等非交易性业务中。由于金融行业带有明显的客户服务属性，加上完整而庞大的业务及数据积累，因此成为语音技术的重要应用阵地。知识图谱知识图谱是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论和方法与计量学引文分析、共现分析等方法结合，并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构以达到多学科融合目的的现代理论。知识图谱在金融智能化的过程中发挥了无可替代的作用，可以说知识图谱是智能金融发展的基础。在金融行业的数据中，存在着大量的实体和关系。通过知识图谱技术将其建立连接形成大规模的实体关系网络，可以突破传统的计算模式，从“实体-关系”的角度整合金融行业现有数据，结合外部数据，从而更有效地挖掘潜在客户、预警潜在风险，帮助金融行业各项业务提升效率、发挥价值。人工智能在金融领域的主要应用场景