大數據

阿里雲開發者社區 x 達摩院 x計算平臺事業部 大數據 + AI向量檢索專場Meetup回顧(內含講師PPT領取)

BigData+AI_Meetup_S04_KV 1920_1080@2x.png

​數據形態的衍生和數據規模的磅礴增長,
讓向量檢索成為了 AI 技術鏈路中重要一環;
數據本身是沒有意義的,
唯有發現、檢索、匹配與運用
才能賦予它們生機。
2021年3月20日,
達摩院領航,
阿里雲開發者社區及阿里雲計算平臺事業部支持的
大數據+AI meetup 向量檢索專場
在北京重磅啟航,
開啟了2021年開發者之間的技術交流旅程。

聚焦於向量檢索技術的發展,來自阿里巴巴、愛奇藝、Zilliz、搜狐、Jina.AI、AI四小龍之一某公司的九位重量級講師在現場分享了他們前沿的向量檢索技術思考與實踐沉澱總結,為線下到場和線上的觀眾深刻解讀了向量檢索的發展及未來,以及落地在廣告搜索推薦、圖片搜索、視頻推薦、文本處理等業務場景的解決方案新思考。在現場,講師們優質的分享內容與生動的案例講解更是引發了現場觀眾的積極互動。

本次會議線上回看地址:https://developer.aliyun.com/live/246509


###現場掠影

導師合影.JPG

現場講師合影

瑞德演講.JPG
現場觀眾.JPG

現場聽眾傾聽講師講解

討論.JPG

茶歇間隙圍繞講師熱烈討論


議題回顧

圖片 1.png

會議出品人開場——《向量檢索的過去,現在,和未來》

  • 議題簡介:

淺談向量檢索的技術背景和應用,揭祕向量檢索的核心挑戰和未來發展趨勢

  • 出品人簡介:

王紹翾,達摩院機器智能實驗室資深技術專家。

阿里花名"大沙",畢業於北京大學,在加州大學獲得計算機工程博士學位。畢業後曾在 Facebook 開發分佈式圖關係數據庫TAO。2015 年加入阿里巴巴集團,先後就職於搜索事業部,計算平臺事業部,目前是達摩院機器智能系統AI實驗室的負責人,主要負責達摩院的AI Engineering的體系建設,包括高性能訓練,推理,向量檢索等等核心引擎的研發,以及視覺,NLP,決策等算法能力的開放平臺建設和商業化落地。在搜索和計算平臺事業部,王紹翾主要負責阿里新一代實時計算平臺Blink/Flink的研發工作,他是國內最早期的Apache Flink的committer和PMC。

圖片 2.png

2、《愛奇藝在推薦領域的向量檢索技術實踐》

  • 議題簡介:

在推薦算法領域,召回-粗排-精排是成熟穩定的系統方案。而傳統過濾/模式匹配的召回算法在個性化、實時、智能推薦的需求上力不從心,對快速增加的各種非數值類特性和海量數據的處理無能為力,同時在線的推理過程對性能又提出了嚴苛的要求。我們結合 Youtube DNN 等多種向量召回模型與重排序的需求,探索了數種向量檢索的服務的技術與產品,結合這些技術 和 Tensorflow Serving,完成廣告、搜索、視頻推薦等業務在愛奇藝的召回基礎服務。

  • 嘉賓簡介:

張吉,愛奇藝深度學習雲研發工程師。

圖片 3.png

3、《Milvus——開源向量搜索引擎》

  • 議題簡介:

隨著深度學習技術的成熟,人們嘗試利用AI技術挖掘非結構化數據(圖片,視頻,自然語言文本等)中潛藏的價值。由此,人們對特徵向量數據的分析處理需求大幅增長。然而通過現有的數據庫組件和大數據技術來支撐這樣的新型應用場景,卻面臨開發困難、運行成本高昂的挑戰。
為了幫助克服現有技術的侷限性,我們發起了 Milvus 開源向量數據庫項目。作為一個開源AI基礎組件,Milvus 加快了企業開發AI應用的速度、大幅降了AI應用的部署成本。

  • 嘉賓簡介:

顧鈞,Zilliz高級架構師&合夥人
北大畢業16年以來始終專注於數據庫、大數據技術,尤其對OLTP平臺與場景有著豐富的經驗。顧鈞現後任職於工商銀行,IBM,摩根士丹利,華為等企業。加入Zilliz以後,顧鈞的工作重心在於開源社區的構建與推廣。同時,顧鈞代表Zilliz出席LF AI & Data基金會中的技術諮詢委員會。

圖片 4.png

4、《MIND - 基於動態路由的用戶多向量召回》

  • 議題簡介:

手淘首頁的推薦面臨著兩個極具挑戰性的問題。一是業務數據量巨大, 包括十億級的用戶和商品; 二是首頁開屏即現, 對算法的響應時間有嚴格要求。在實際實踐中, 我們將推薦系統拆分為召回與排序兩個子系統。其中, 召回系統從海量的候選商品中挑選出與用戶興趣相關的商品集合, 排序系統對該商品集合中的每一個商品依據業務目標進行打分, 打分較高的商品作為推薦結果展示給用戶。推薦算法的效果同時受到兩個子系統的影響, 召回作為算法的前置環節, 更是決定了整個系統的效果上限。本次分享中, 我們將分享 MIND 召回算法及其系統架構設計。

  • 嘉賓簡介:

睿德,淘系技術部高級算法專家。從事推薦技術召回, 排序算法的開發。

圖片 5.png

5、《Jina:雲原生開源神經搜索框架》

  • 議題簡介:

隨著信息規模的爆炸式增長和數據類型的日益豐富,基於符號的傳統搜索逐漸無法滿足用戶的需求。得益於深度學習技術的發展,神經搜索系統應運而生。但是,在搭建和維護神經搜索系統的過程中,工程團隊不僅需要具備分佈式架構的經驗,更需要熟悉多個軟件框架和理解不同AI算法。針對這個痛點,Jina提供覆蓋搜索全鏈路的一站式雲原生開源解決方案。在本次報告中,我們將分享Jina的設計思想和主要特點,並展示如何使用Jina搭建神經搜索系統。

  • 嘉賓簡介:

王楠,博士,Jina AI聯合創始人兼CTO。
專注於機器學習和深度學習算法在NLP和搜索領域的實際應用。作為開源神經搜索框架jina的核心貢獻者,熱衷於開源軟件和雲原生技術。

圖片 6.png
6、《高性能高維向量計算》

  • 議題簡介:

在深度學習流行的當下,向量計算已經成為 AI 工程的基石,無論是人臉比對、圖像搜索、推薦、智能問答都涉及到海量高維向量的計算。檢索和聚類是其中兩個典型的計算場景,面向海量向量的檢索通常採用 ANN 一簇算法解決,無監督聚類算法也正在蓬勃發展;除開算法,工程架構上的挑戰也是巨大的,比如怎樣適配端側設備、國產芯片等異構計算環境。本次演講,我們會分享雲從在大規模人臉比對領域上的實踐心得,探討向量計算未來的發展方向。

  • 嘉賓簡介:

楊傑,國內某AI四小龍之一數據研究院技術總監。
在雲從主要負責 KaaS 平臺(向量計算、知識圖譜、搜索等技術方向)研發,在AI工程化方面有深厚的積累。互聯網行業歷練技術十餘年,有豐富的搜索、推薦系統研發經驗。

圖片 7.png
7、《達摩院 Proxima 向量檢索技術揭祕》

  • 議題簡介:

淘寶搜索推薦、螞蟻人臉支付背後的檢索技術,達摩院向量檢索引擎 Proxima 揭祕。Proxima 是阿里巴巴達摩院系統 AI 實驗室自研的向量檢索內核,廣泛應用於阿里巴巴和螞蟻集團內,為淘寶搜索和推薦、螞蟻人臉支付、優酷視頻搜索、阿里媽媽廣告檢索等核心業務提供核心檢索能力。並深度集成在阿里雲 Hologres、搜索引擎 Elastic Search 和 ZSearch、離線引擎 MaxCompute (ODPS) 等大數據和數據庫產品中

  • 嘉賓簡介:

肖允鋒(鶴衝),達摩院機器智能實驗室資深技術專家。
畢業於中山大學物理系,曾就職於電信研究院和騰訊科技,從事大數據搜索技術相關研究和應用十餘載,是阿里巴巴達摩院 Proxima AI 檢索引擎的總設計者和技術帶頭人。目前,Proxima 相關技術廣泛應用於阿里巴巴和螞蟻金服各大業務,算法和工程在業內具有一定的領先性。

圖片 8.png
8、《基於語義向量的內容召回和短文本分類的文本標註-搜狐的 Mlivus 實戰》

  • 議題簡介:

得益於 Mlivus 向量搜索工具的高效部署,在處理海量數據時準確快速,本次演講中,我們將分享利用 Milvus 向量搜索工具解決語義向量召回時的向量搜索問題和短新聞文本分類時文本的標註問題。

  • 嘉賓簡介:

王婷婷,搜狐自然語言處理工程師。
在搜狐主要從事基於內容的語義向量召回,文本分類,文本摘要,新聞聚類,新聞關鍵詞提取等相關工作。

圖片 9.png
9、《雲上個性化推薦—— 基於 PAI 和 Hologres 的個性化推薦最佳實踐》

  • 議題簡介:

常見的個性化推薦系統包括日誌收集,數據加工,召回,排序,離在線效果評估等諸多環節,對於中小客戶存在技術門檻高,搭建週期長等問題。計算平臺基於 PAI,Hologres,MaxCompute,DataWorks 平臺產品,可以幫助客戶快速搭建個性化推薦解決方案。本次分享,主要從計算平臺的推薦系統整體解決方案出發,重點介紹基於PAI的向量召回算法和 Hologres 向量檢索的整體架構,以及該架構在某社交 APP 的落地案例和效果分享。

  • 嘉賓簡介:

天邑,阿里雲計算平臺高級算法工程師
主要從事基於PAI平臺的召回和排序算法研發,及基於雲產品的推薦系統解決方案研發,賦能客戶個性化推薦解決方案落地。


福利時間

掃描下方二維碼關注“AI檢索技術博客“公眾號,

回覆“320”即可領取本次meetup講師全部PPT!

qrcode_for_gh_e1b0e5dea42d_430.jpg

本站meetup落下帷幕,
但開發者們對於技術的熱愛與探討仍將延續;
向量檢索技術的熱度仍未休減,
將持續融入更多業務生態中,
助力產業創新的發展。
在今後,
達摩院將邀請 AI 檢索領域更多的開發者
定期舉辦具有學習價值的Meetup活動。

掃描上方二維碼
關注“AI檢索技術博客”公眾號,第一時間獲取相關Meetup資訊以及精彩技術文章!

Leave a Reply

Your email address will not be published. Required fields are marked *