- +1
PyTorch核心開發(fā)者靈魂發(fā)問:我們怎么越來越像Julia了?
夢晨 發(fā)自 凹非寺
量子位 報道 | 公眾號 QbitAI
PyTorch社區(qū)最近有一種聲音:下個版本應(yīng)該拋棄Python改用Julia語言。
現(xiàn)在就連PyTorch團(tuán)隊內(nèi)部也會拿這個說法來開玩笑。
對這個問題,核心開發(fā)成員中的Edward Yang在論壇上作出過一些回應(yīng)。
他認(rèn)為PyTorch的確越來越像Julia了,比如借鑒Julia的多重分派特性開發(fā)了Pytorch Dispatcher。PyTorch總體的發(fā)展方向也和Julia的愿景一致,也就是同時具備拓展性、易用性和執(zhí)行性能。
一方面PyTorch的底層代碼后期用C++重寫以獲得更好的性能,另一方面functorch、fx等新功能又讓用戶可以直接使用Python做以前必須借助C++完成的工作。
那為什么不直接改用Julia呢?
害,其實是舍不得Python那無可替代的生態(tài)。
當(dāng)初從原版Torch使用的Lua改用Python就是看中了生態(tài)這一點。這么多年過去了其他語言生態(tài)連一點可能超過Python的跡象都沒有。
簡而言之,Julia語言本身的特性和Python的生態(tài)他們?nèi)家?,向Julia的優(yōu)點學(xué)習(xí)也是團(tuán)隊未來的努力方向。
那么,Julia這種語言到底好在哪,讓PyTorch開發(fā)團(tuán)隊都向它學(xué)習(xí)?面向科學(xué)計算設(shè)計的語言
Julia來自麻省理工CSAIL實驗室,設(shè)計初衷就是想要一個既有C的速度又有Ruby的動態(tài)性、既能像Matlab一樣使用數(shù)學(xué)表達(dá)式又有Python的通用性。
Julia要能像Perl一樣自然地處理字符串、像R一樣適用于統(tǒng)計,像Shell一樣作為膠水語言去和其他語言交互。
要有Hadoop的并行計算能力,又不想要那些繁雜的配置。
最后做出來的Julia采用即時編譯(Just In Time),速度比需要解釋器的Python快得多,又沒有失去交互性。
通過多重分派(Multiple Dispatch)特性來實現(xiàn)類型穩(wěn)定又不時腳本語言的簡潔靈活。
同一個函數(shù)名對不同參數(shù)類型的調(diào)用分派不同的操作,因為適合處理多種數(shù)據(jù)類型還被PyTorch給學(xué)了去。
具體到機(jī)器學(xué)習(xí)來說,Julia執(zhí)行各類算法包括矩陣運算的速度都比Python快得多。
Julia生態(tài)里也有自己的開源深度學(xué)習(xí)框架Julia Flux。
此外Julia還在語法上對線性代數(shù)、數(shù)據(jù)處理這些場景有額外的優(yōu)化。比如支持Unicode數(shù)學(xué)符號,數(shù)字乘以變量時候可以省略「*」,以及索引從1而不是0開始更符合人類直覺….
Julia代碼可以寫成這樣:
α = 0.5 ?f(u) = α*u; ?f(2) sin(2π)
以至于有些數(shù)學(xué)背景的開發(fā)者認(rèn)為,Julia代碼寫起來就像在黑板上做數(shù)學(xué)題一樣的,很親切。
相比之下,用Python做矩陣運算感覺就……不是那么好。Python:
np.dot(array1,array2)
Julia:
array1 .* array2
Julia的歷史可以追溯到2009年,由于想實現(xiàn)的功能太多,直到2018年才對外發(fā)布1.0正式版。
不過最近幾年Julia已迅速被金融、醫(yī)藥、航天等一些行業(yè)接受,使用者包括摩根大通、輝瑞、NASA等。
△ TIOBE指數(shù)中的Julia流行趨勢變化Julia改變了過去他們只能用C等高性能語言做底層開發(fā)、同時用高易用性的Python等語言做擴(kuò)展開發(fā)的割裂問題。
今年7月,Julia創(chuàng)始團(tuán)隊成立的公司Julia Computing還獲得2400萬美元的A輪融資。
Julia語言速度快、天生適合機(jī)器學(xué)習(xí)又在高速成長,也難怪PyTorch社區(qū)會有用Julia替代Python的聲音出現(xiàn)。
有人認(rèn)為Python是一種糟糕的語言,雖然有優(yōu)秀的生態(tài),但生態(tài)中對機(jī)器學(xué)習(xí)最有價值的部分(Numpy)其實是用C實現(xiàn)的。
Python生態(tài)雖然強(qiáng)大,但人們對其中的混亂也有不少詬病,各種重復(fù)開發(fā)的包管理系統(tǒng)讓配置好Python開發(fā)環(huán)境都不是一件容易事。
相比之下,Julia的包管理方案就很統(tǒng)一,雖然有可能是還在起步階段沒來得及混亂。也有人認(rèn)為Python這些所謂的缺點其實正是它流行的原因。
像Python、Javascript和PHP這種看起來糟糕的語言,正是因為能夠輕松的編寫糟糕代碼,降低了門檻而流行。
這位要提醒大家Julia自身就帶有和其他語言的交互功能,他平常會在Julia代碼里調(diào)用Huggingface的Python模型作開發(fā),兩種生態(tài)都用上才是墜吼的。
最后,有人很不理解PyTorch開發(fā)團(tuán)隊不選擇遷移到Julia的做法,既然Julia語言有所有他們需要的特性,還要花時間在Python里重新造輪子是自找麻煩。
另一位的視角有些微妙的不同:這正是PyTorch團(tuán)隊想把方便留給用戶,而把麻煩留給自己。對這種態(tài)度我很感激。
參考鏈接:
[1]https://dev-discuss.pytorch.org/t/where-we-are-headed-and-why-it-looks-a-lot-like-julia-but-not-exactly-like-julia/276
[2]https://news.ycombinator.com/item?id=29354474
[3]https://ucidatascienceinitiative.github.io/IntroToJulia/Html/WhyJulia
— 完 —
本文系網(wǎng)易新聞?網(wǎng)易號特色內(nèi)容激勵計劃簽約賬號【量子位】原創(chuàng)內(nèi)容,未經(jīng)賬號授權(quán),禁止隨意轉(zhuǎn)載。
原標(biāo)題:《PyTorch核心開發(fā)者靈魂發(fā)問:我們怎么越來越像Julia了?》
本文為澎湃號作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2026 上海東方報業(yè)有限公司




