開發與維運

連續三年蟬聯第一,Flink 榮膺全球最活躍的 Apache 開源項目

2020年,一個註定會被歷史銘記的一年。在全球化合作受到挑戰的大環境下,作為全球最大的開源軟件基金會,Apache 軟件基金所引領的開源社區,依然匯聚了全球的頂尖開發人員,交出了一份鼓舞人心的成績單。2021年1月1日,Apache 基金會在其官方博客上發表了文章《Apache in 2020 - By The Digits》[1],用數字回顧了2020 一整年的社區發展:

Apache 軟件基金會在過去的一年中,來自各個領域共計 238 個項目共迭代了接近 3500 個發佈版本。
Apache 軟件基金會的所有開源軟件在如今貢獻著超過 220 億美元的價值。
Apache 的線上會議吸引了超過 150 個國家接近 5750 名參與者,為期兩天的Apache Con 更是吸引了超過 150 萬的瀏覽。

而 Apache Flink 作為 Apache 軟件基金會 199 個頂級項目中的一員,在這份報告中,無論從社區用戶活躍度、開發者活躍度,還是曝光度等多個維度上,都取得了卓然的成績。

社區郵件列表活躍度:TOP 1

郵件列表(mailing list)是 Apache 軟件基金會各個項目常用的,用於開發者和使用者之間進行溝通的渠道,一般分為開發者交流 (dev@ mailing list)和用戶交流(user@ mailing list)兩個頻道,我們往往會用郵件列表的活躍度來反映社區的交流溝通活躍度。2020年,Flink 取得了用戶交流郵件頻道第一名和開發者交流頻道第二名的好成績:

image.png

特別值得一提的是,在前20名郵件列表中,Flink 社區是唯一提供中文用戶交流頻道的([email protected]),而且其活躍度在2020年中僅次於 Flink 的英文用戶郵件列表。自2018年開始,Flink 在郵件列表的活躍度已連續三年蟬聯第一,我們很欣喜地看到越來越多的中文母語使用者在開源社區中發聲,為全球開源軟件社區帶來不可忽視的影響力。

Commits 提交:TOP 2

開源項目在過去一年的新增提交(commit)數,是一種常用的衡量開源項目開發活躍度的指標。Apache 軟件基金會每年都會公佈去年的最多提交數的前五名,而 Flink 在2020年度新增 commit 數目中排名第二,僅次於路由引擎構建構建軟件Apache Camel。如果把範圍限制在大數據計算/存儲領域,Apache Flink 則是當仁不讓的開發者最活躍的項目。如果放眼到過去的 2019 [2]、2018年 [3] 年度報告,每年的最活躍的5個開源軟件中,都能看到大數據領域的身影,其中 Flink、Hadoop、HBase、Beam、Airflow、Spark 均有過上榜,我們繪製瞭如下的表格來描述這一趨勢(由於只公佈了 TOP5,所以有些項目會在某些年份落榜):

image.png

Apache Flink 是唯一近三年都連續出現在 TOP5 中,並且排名不斷上升的大數據相關開源項目。

由於每年的 TOP5 名單都會發生變化,我們又對近三年上過榜的項目統計了 commits 數目[4],並繪製瞭如下的統計圖表,可以看出 Flink 的 commit 數目逐年增長,並且在2020年表現十分亮眼,進一步擴大了其在大數據項目中的優勢。

image.png

GitHub 訪問量:TOP 2

Apache Flink 社區除了在開發和用戶交流方面有著極高的活躍度,其在互聯網世界中還有著極高的曝光量和瀏覽度。Apache 軟件基金會統計了2020年度訪問 Flink 的 Github 頁面的流量,在所有項目中位居第二。

由於2018、2019年的 Apache 軟件基金會的自然年年度總結報告中並沒有展示這一指標,我們在2019財年(2018.5.1 - 2019.4.30)年報[5] 和2020財年(2019.5.1 - 2020.4.30)年報[6]中找到了 Github 訪問流量的指標:

image.png

可以看出,從2018年年中開始,Flink 的曝光瀏覽度從總第三名上升到2020年的第二名。

總結

通過 Apache 軟件基金會2020年的總結,並結合 2018、2019 年的總結、財年年報,我們可以看到 Flink 已經毋庸置疑地茁壯成長為 Apache 頭部項目之一。無論是用戶交流活躍度、開發活躍度、還是影響力等多方面都已經穩居在 Apache 所有開源軟件項目 TOP 位置。

同時,剛剛落幕的 Flink 社區年度盛會 Flink Forward Asia 2020,我們也見證了 Flink 社區的高速發展與技術創新、流批一體在生產環境的落地,越來越多的企業如字節跳動、小米、網易、知乎等都在探索使用 Flink 做流批一體統一架構的方案。

這其中,來自中國的大量開發者和用戶無疑是其能取得相關成績的最重要的原因之一,正在閱讀本文的您,想必也正在為 Apache 的最頂尖項目之一貢獻著一份力量。如今,2021年已然到來,相信在新的一年中,Apache Flink 會繼續朝著流批一體化、離線實時一體化、大數據與 AI 一體化演進,取得更大的成績!

實時即未來,Flink 社區期待您的參與!

參考文獻

[1] Apache in 2020 - By The Digits
https://blogs.apache.org/foundation/entry/apache-in-2020-by-the
[2] Apache in 2019 - By The Digits
https://blogs.apache.org/foundation/entry/apache-in-2019-by-the
[3] Apache in 2018 - By The Digits
https://blogs.apache.org/foundation/entry/apache-in-2018-by-the
[4] commits數統計參考命令 git rev-list --after="Jan 1 2020" --before="Jan 1 2021" --all --no-merges --count
[5] Apache FY2019 annual report
https://files-dist.s3.amazonaws.com/AnnualReports/FY2019+Annual+Report.pdf
[6] Apache FY2020 annual report
https://www.apache.org/foundation/docs/FY2020AnnualReport.pdf

社區二維碼.png

Leave a Reply

Your email address will not be published. Required fields are marked *