人工智慧 – 小科科的春天

🚀 Google AI Plus：智慧融合與負責任的創新

click / 2025-10-29

Google AI Plus 代表了 Google 在人工智慧領域的進階策略和技術整合，重點在於開發更強大、更具備泛用性，並深度融入生態系統的 AI 解決方案。它不僅關乎技術突破，更關乎大規模的實用化和道德框架。核心焦點與特色特色領域描述頂尖模型 (Gemini) 開發如 Gemini 這樣具備多模態、複雜推理與規劃能力的世界級基礎模型。生態系統整合將 […]

人工智慧

收藏 | Tensorflow实现的深度NLP模型集锦（附资源）

click / 2019-08-25

来源：深度学习与NLP 文章来源：微信公众号数据派THU 本文收集整理了一批基于Tensorflow实现的深度学习/机器学习的深度NLP模型。收集整理了一批基于Tensorflow实现的深度学习/机器学习的深度NLP模型。基于Tensorflow的自然语言处理模型，为自然语言处理问题收集机器学习和Tensorflow深度学习模型，100%Jupeyter NoteBooks且内部代码极为简洁。资源整理自网络，源地址： https://github.com/huseinzol05 目录 Text classification Chatbot Neural Machine Translation Embedded Entity-Tagging POS-Tagging Dependency-Parser

人工智慧

独家 | 一文读懂机器学习中的贝叶斯统计学

click / 2019-08-25

作者：Matthew Stewart, PhD Researcher 文章来源：微信公众号数据派THU 翻译：吴金笛校对：丁楠雅 —- 本文主要是向新手介绍贝叶斯方法并将其与频率方法进行比较。你有没有问过自己，以前从未发生过的事件发生的概率是多少？在本文中，我们将深入探讨贝叶斯统计的神秘世界以及它的一些原则，Bernstein-von Mises定理和Cromwell规则，以及用它们分析现实世界的机器学习问题。 “贝叶斯统计之所以困难，是因为思考是困难的” Don Berry 如果你想深入了解贝叶斯统计背后的数学原理，那么这篇文章不是你要找的（尽管未来我将发表关于这个的文章）。本文主要是给刚刚接触这个概念的人介绍贝叶斯方法。想象一下，你正在设计一座核电站。你的任务是使用数据来确定工厂是否正常运转。这看起来似乎是一个相对简单的任务，直到你意识到你实际上没有任何关于核电站发生核泄露时的数据。你怎么能预测这样的事情呢？如果你是一个精明的机器学习专家，你可能会提出某种无监督的方法，如（受限制的）波耳兹曼机，它能够了解“正常”的发电厂是什么样的，从而知道什么时候发生了错误（事实上，这是正人们预测核电厂正常运行情况的一种方式）。然而，如果我们从更广泛的意义上考虑这个问题，当我们没有什么负面例子可以比较时，我们该怎么办？出现这种情况有几个原因：

人工智慧

独家 | 脑洞大开！机器学习与AI突破（附链接）

click / 2019-08-25

作者：Jerry Chi（SmartNews数据科学主管）文章来源：微信公众号数据派THU 翻译：和中华校对：丁楠雅 —- 本文介绍了近期在机器学习/人工智能领域一些非常有创意的突破，每一个都脑洞大开，不管是否是相关从业人员都值得一读。本文介绍了一些近期在机器学习和人工智能领域最受欢迎的突破，并附上一些论文、视频链接和简要总结。与其他领域相比，机器学习/人工智能现在发展的非常快，经常有一些有趣的突破。让你不由自主的发出“wow”甚至“人间值得”的感叹！（两分钟论文作者的口头禅）两分钟论文 https://www.youtube.com/channel/UCbfYPyITQ-7l4upoX8nvctg 免责声明：我并没有对“振奋人心”或“突破”进行严格的定义；这只是一个非正式的清单。我会用可能不那么严格的术语来让这篇文章更通俗易懂。从看似不可用的信息中得出惊人的准确估计透过墙对人体姿态做估计麻省理工学院研究人员的网站/视频，2018年 http://rfpose.csail.mit.edu/ 我们可以根据某人对WiFi信号的扰乱，准确地估计此人在墙壁另一侧是如何站着/坐着/走路的。从视频中测量材料的物理特性麻省理工学院研究人员的文章/视频，2015年

人工智慧

为了让网速更快，阿里工程师与顶级数学家有一个大胆猜想

click / 2019-08-25

2008年，当英国数学家Frank Kelly凭借原创性的网络理论拿下运筹优化学的“诺贝尔” — 冯·诺依曼理论奖，可能并不会想到，11年后，他还将亲自参与“重塑”这一心血之作的全过程。邀请他共建新理论的朋友是一群从读博期间就熟读Frank Kelly著作，受其影响的年轻人。同时，他们的另一个身份是阿里巴巴工程师。阿里代表正在SIGCOMM 2019做分享近日，他们提出了双方合作的研究成果HPCC，对高性能网络的拥塞控制这一世界级难题提出了一种全新的算法，同时在世界顶级的学术会议SIGCOMM 2019上发表，这也标志着阿里巴巴在基础研究上又一重大突破。这样的CP结缘于阿里云栖大会数学大赛。年近6旬的Frank Kelly是全球知名的数学家，曾因成功通过经济学理论建模和解释了互联网技术中最基础的传输协议TCP（Transportation Control Protocol）拥塞控制而声名大噪：他用经济学理论对TCP的收敛性和公平性做出分析，从理论上论证了TCP在互联网环境下的稳定性和有效性。而在当时，张铭（现为阿里云智能研究员）正在普林斯顿大学的攻读博士，Kelly教授的著作正是他常读的经典论文之一，其中不少观点对张铭日后的网络研究大有启发。 Frank Kelly与阿里HPCC相关论文作者合影随着云计算的迅猛发展，面向大规模数据中心的高性能网络架构正成为主流，FrankKelly教授当年所论证的TCP拥塞控制在新一代高性能网络中面临严峻挑战，这也正是当下数据中心网络里面临的核心难题之一。 2018年9月，Frank Kelly受邀到杭州参加阿里数学大赛开幕仪式，在与张铭所属的阿里基础设施网络团队交流中，了解到目前高速网络拥塞控制遇到的挑战。 Frank

人工智慧

《视觉SLAM十四讲：从理论到实践》| 每日读本书

click / 2019-08-25

编辑推荐适读人群：本书适合对SLAM感兴趣的读者阅读，也适合有志于从事计算机视觉、机器人研究等领域的广大学生阅读，可作为SLAM技术的入门教材。 SLAM技术是全自动无人驾驶、无人机、机器人等人工智能产品的核心技术之一。本书作者是SLAM领域非常杰出的青年专家。书中不仅有深入浅出的讲解，同时注重理论和实践结合，大大降低了国内学生和相关从业者的进入门槛。高翔张涛等著 / 2017年3月出版内容提要《视觉SLAM十四讲：从理论到实践》系统介绍了视觉SLAM（同时定位与地图构建）所需的基本知识与核心算法，既包括数学理论基础，如三维空间的刚体运动、非线性优化，又包括计算机视觉的算法实现，例如多视图几何、回环检测等。此外，还提供了大量的实例代码供读者学习研究，从而更深入地掌握这些内容。《视觉SLAM十四讲：从理论到实践》可以作为对SLAM 感兴趣的研究人员的入门自学材料，也可以作为SLAM 相关的高校本科生或研究生课程教材使用。作者简介高翔 2008年就读清华大学自动化系，2012年免试进入清华大学自动化系攻读博士学位。研究课题为视觉SLAM，兴趣包括计算机视觉与机器学习。曾撰写过与SLAM相关的论文和技术博客。张涛清华大学自动化系教授、党委书记、副系主任。1995年9月至1999年9月在清华大学自动化系检测技术与自动化装置专业学习，获博士学位。1999年10月至2002年9月在日本国立佐贺大学大学院工学系研究科系统控制专业学习，获博士学位。研究课题包括机器人、航空航天、计算机视觉等。

人工智慧

2019云栖大会支付宝硬核技术来了

click / 2019-08-25

9 月 25 日，一年一度的杭州云栖大会即将来临，蚂蚁金服将把珍藏多时的秘密技术武器首次向大众公开，在开设的数字金融技术和金融智能分论坛，以及其它技术论坛里，将首次完整介绍金融级云原生理念、共享智能、融合计算、安全计算、图计算等前沿技术，以及这些技术在金融领域的应用实践。下面介绍一些重点的议题，欢迎关注。金融级云原生:面向未来的金融技术架构最佳实践从去年开始，云原生、Kubernetes、容器这些关键字逐渐从社区走向金融科技圈，越来越多的金融机构开始学习了解，云原生技术是什么，能够给企业带来什么价值，对现有业务有什么影响？落地的路径可能会是哪些？云原生不但可以很好的支持互联网应用，也在深刻影响着新的计算架构、新的智能数据应用。以容器、服务网格、微服务、Serverless 为代表的云原生技术，带来一种全新的方式来构建应用。此外，云原生也在拓展云计算的边界，一方面是多云、混合云推动无边界云计算，一方面云边端的协同。云原生时代，也是云厂商更好发挥作用、为客户提供更多价值的时代。本次云栖大会上我们会首次分享金融级云原生的架构全景图，以及基于它的金融级混合云到底该如何做。安全计算:构建软硬件全链路的纵深防御蚂蚁赖以立足的互联网金融，本质上是对大量敏感数据的处理以及由此沉淀的作为蚂蚁核心资产的关键业务智能。近年来涌现出来的新业态更是将数据处理的范畴从单方数据扩展到了涉及蚂蚁和合作方的多方数据。另一方面，从 GDPR 到 HIPPA，数据隐私监管保护的范围愈加扩大，力度日益增强。可见，对蚂蚁金融数据和关键业务智能的安全保护，不仅是蚂蚁核心业务的基础，也是蚂蚁创新发展的依托，更是攸关公司合规存亡的关键因素。蚂蚁安全计算，以可信硬件和创新隔离技术为基础，构造从主机安全，到容器安全，再到关键业务保密安全的全链路、纵深式、集群化安全计算环境，为达成 102 年的小微金融服务使命保驾护航。共享智能首次公开:如何破解数据孤岛随着人工智能兴起，数据的质量和数量已成为影响机器学习模型效果最重要的因素之一，但在数据共享的过程中不可避免会涉及到两个问题：隐私泄露和数据滥用。蚂蚁共享智能技术，基于可信硬件执行环境及安全多方学习等技术，能够聚合多方信息进行学习，并保护参与方的数据隐私，已在蚂蚁多个业务场景中应用。更多技术细节可查看我们之前的介绍文章《共享智能：蚂蚁金服数据孤岛解决方案》。随着全球数据隐私保护关注度上升，数据孤岛将是所有利用大数据和 AI

人工智慧

使用SAP Cloud Platform Leonardo机器学习的测试控制台

click / 2019-08-25

选中一个需要进行测试的Leonardo机器学习服务，点击Configure Environments：因为我不想使用sandbox环境，所以我选择了eu10这个region：维护clientid和secret：在SAP Cloud Platform cockpit里创建了service key后，会得到这个client id和secret。要消费机器学习api，先要获得Access Token：把postman里得到的Access Token填到API测试控制台的Authorization字段里，执行，就能提取到图片的feature了。本文来自云栖社区合作伙伴“汪子熙”，了解相关信息可以关注微信公众号”汪子熙”。

人工智慧

《深入浅出深度学习：原理剖析与Python实践》| 每日读本书

click / 2019-08-22

编辑推荐本书最大的特色在于取舍明确，一切无助于迅速理解深度学习精髓的内容全被摒弃了，并着重阐述了技术上的重点和难点；表达上深入浅出：即便是从未接触过AI知识的人，也能从作者简明清晰的表述中，一窥深度学习的殿堂。对任何一位想成为AI/深度学习领域工程师的读者来说，《深入浅出深度学习：原理剖析与Python实践》能帮你迅速打开AI的大门，并成长为一名合格的AI工程师。黄安埠著 / 2017年6月出版内容提要《深入浅出深度学习：原理剖析与Python实践》介绍了深度学习相关的原理与应用，全书共分为三大部分，第一部分主要回顾了深度学习的发展历史，以及Theano的使用；第二部分详细讲解了与深度学习相关的基础知识，包括线性代数、概率论、概率图模型、机器学习和最优化算法；在第三部分中，针对若干核心的深度学习模型，如自编码器、受限玻尔兹曼机、递归神经网络和卷积神经网络等进行详细的原理分析与讲解，并针对不同的模型给出相应的具体应用。《深入浅出深度学习：原理剖析与Python实践》适合有一定高等数学、机器学习和Python编程基础的在校学生、高校研究者或在企业中从事深度学习的工程师使用，书中对模型的原理与难点进行了深入分析，在每一章的最后都提供了详细的参考文献，读者可以对相关的细节进行更深入的研究。最后，理论与实践相结合，《深入浅出深度学习：原理剖析与Python实践》针对常用的模型分别给出了相应的应用，读者也可以在Github中下载和查看《深入浅出深度学习：原理剖析与Python实践》的代码。作者简介黄安埠 2012年毕业于清华大学，获硕士学位，在校期间活跃于TopCoder等编程竞赛社区。现为腾讯基础研究高级工程师，研究领域包括个性化推荐、自然语言处理和大规模的相似度优化计算，特别是对于深度学习在推荐系统的应用有深入的研究，并申请了国内十余项相关专利。媒体评论在这个人工智能红红火火的年代，写出一本能让初学者和“老司机”同样感到非常有用的机器学习书是一件很有意义却又不容易的事。黄安埠的《深入浅出深度学习：原理剖析与Python实践》就做到了这一点。本书从最基本的人工智能假设出发，回顾了人工智能的发展简史，很自然地把读者带入现代常用的算法、思想和实践中。从数学基础，到编程例证，再到各个流行的开源软件包，本书起到了入门与工具的作用。同时，书的后半部也帮助读者深入了解深度学习的思维和实践。我一直在寻找一本既可以用于教学也能给学生动手做系统的工具书，现在很高兴地向大家推荐：本书就可以达到这个目的。 —— 杨强香港科技大学计算机系主任，中国人工智能协会副理事长本书内容全面，但是取舍明确，有重点地深入，尤其对于技术的重点难点解释得很详细，深入浅出：着重于原理的解释和动手实践的路径，但是并不拘泥于细枝末节。

人工智慧

【面小易-面经01】阿里巴巴Java开发工程师面试总结

click / 2019-08-21

转眼间，又到了 “金九银十” 的招聘季，各位需要找工作的小伙伴们是不是已经摩拳擦掌，跃跃欲试了呢？想必对于大家而言，能够进入像阿里巴巴这样的互联网巨头是一件十分令人羡慕的事情，单纯是想想或许都能够从梦中笑醒。但是想要进入阿里巴巴，光是“仰望星空”还远远不够，必须要脚踏实地地完善自己。当然了，必然也少不了要学习一些面试技巧。此时，就是我面小易登场的时候咯！先来一段定场词：“我是面小易，机智又聪明。面试不眨眼，Offer不手软。” 接下来的一段日子里，就让我面小易和各位一起学习各位前辈总结的真实面试经验，为大家的“金九银十”求职之路保驾护航。今天和大家分享的这篇面试经验来自一个自动化控制专业的同学，他学习Java完全是因为兴趣，他所投递的岗位是阿里巴巴的Java开发工程师，而且这是他人生中的第一次面试，就让我们一起来看看他的面试经历吧。以下为正文第一面第一天下午三点左右，当时刚好在教研室自习时，我接到一个杭州打来的电话，阿里的面试官简单说明来由，就问我是否方便面试，我说可以，然后让我先自我介绍。说实话，阿里是我正式接到的第一个面试，所以根本没有准备。我就简单地介绍了自己，然后把项目提了一下，果然面试官会针对他感兴趣的东西问，面试官问了我算法大赛的情况和项目情况，但都只是简单的说明了一下整个思路，并未深入，然后问了几个Java基础问题。第一面大约用了30分钟左右，面试官就说，那今天就到这里了，于是结束了第一面。对于第一面而言，感觉更多的是宽泛地了解Java知识面。我还是比较幸运的，所问的几个问题我都大概的都知道一些，虽然回答的并不是很好，但是每一次面试的问题都记录下来，后续再学习。面小易说：对于第一面而言，不慌不忙很重要，阿里的面试官总喜欢“搞突击”，所以一旦准备投阿里，就需要准备好面试的开场白，这样才能不慌张。第二面第二面来的很快，第二天晚上八点多就接到了面试电话。面试官人很好，没有再自我介绍，直接切入主题，针对我的项目开始具体问，我说做的一个模仿QQ聊天的软件，他问我你有没有考虑过性能的问题，如果出现卡顿，你会怎么解决。说实话，做这个项目纯练手的，未考虑到上线测试。于是我说，我自己做着自己练习的，模仿着功能，自己纯手写的，未考虑到这些。我问面试官性能方面的问题，可以具体一点么？面试官问我，如果你在传送文件时卡住，还想发送聊天信息，你怎么解决，我说那就重新开启一条线程处理，将聊天与发送文件线程隔离开，互不影响。面试官说好，我知道了，就没再深入下去。后面，针对这个问题，我私下找了解决方案，NIO非阻塞编程以及Reactor单线程模型，这个可以去网上搜集资料看看，这些都是解决多线程通信的问题。私下了解到，其实阿里也在用Netty技术，这门技术也是基于Reactor实现的通信技术，它是用来处理大并发，大容量的通信技术，所以阿里其实面的每一个问题，都是有针对性的，在这一点上，我没有答到点子上，不够完善，应该是没有给出面试官想要的答案，但是面试官没有在这上面为难我，放我进去了三面，还有针对算法大赛的提问，因为是自身的项目，所以说的很啰嗦吧，面试官听完没有深入追问，可能只是想听我的表述能力吧，看看我的思路。还有项目就不重复叙述了，与各位项目实在是小巫见大巫了，大家好好准备自己的项目就可以了，肯定是会提问的。面小易说：对于项目问题，一定要有一说一，不需要夸大，因为在学校做的项目和在企业做的项目而言，根本算不上什么。即使自己做的很简单，但只要你有更多的想法和思路，都可以探讨。但是要切记不要夸大自己的项目，一定要实事求是。第三面第三面隔得就比较久了，大约过了一个星期才来电话。上来面试官就跟我说，时间比较紧，我们就长话短说，你随时可以打断我，我说好的，然后就开始了，这次面试官问了一些基础问题。然后开始针对实际问题提问，第一个比较简单，如果有一组重复数字，我要你找出来，你怎么解决，这个我当时就说HashSet集合，可以去重复，然后我又问，是要找出重复数字？面试官说是的，然后我就说用HashMap,将数字作为Key，出现次数作为value，然后再遍历，找出value大于1的Key,就是所要答案了，面试官说好的，然后又问我，有一个比赛，你去商场购物，给你一个购物车，你如何在商场中，在装满购物车的情况下实现价值最大，装不下的就不可以装，当时我就迷糊了，但是仔细一想，利用动态规划可以做，贪心算法限制条件下结果不准确，具体的，各位私下看看，网上有很多资料，然后面试官好像挺急的，最后面下来17分钟，结束了第三面。面小易说：这位同学在第三面就遇到了算法面试咯，大家在面试之前一定要准备好高频问题的分析。比如面试官问题的购物车问题，其实就是一个背包问题嘛。第四面第四面也是隔了一个星期，当时跟学弟在教研室。说真的，苦等真的是劳神，有好几晚我都没睡好，不晓得电话什么时候打来。每天早九点待在教研室，晚十点多回宿舍，一刻不敢掉以轻心。面试完就开始总结、学习、准备，每天下午就最难熬了，电话一刻不离手，生怕错过。