大家都在媒體平臺聽說過Python,那么Python庫都有哪些呢?Python常用庫包括圖像處理,文件處理,大數(shù)據(jù)與科學計算,游戲與多媒體,人工智能與機器學習,數(shù)據(jù)庫等等。要知道Python的大多數(shù)機器學習庫都依賴于這兩個模塊,Scipy和Numpy經(jīng)常是合并使用的。pycuda/opencl,GPU高性能并發(fā)計算。python實現(xiàn)的是分析平臺,數(shù)據(jù)統(tǒng)計,類似于R語言。以Matplotlib和NumPy為基礎,它主要用于數(shù)據(jù)分析以及數(shù)據(jù)可視化,其數(shù)據(jù)結構DataFrame和R語言中的data.frame類似,特別是對具有自己的時序數(shù)據(jù)分析機制的DataFrame來說,特別常好。

商業(yè)智能(BI),Pandas的網(wǎng)絡接口。Blaze,NumPy和Pandas的大數(shù)據(jù)接口。SciPy是一個開源的Python算法庫和數(shù)學工具箱,它包含了優(yōu)化、線性代數(shù)、積分、插值、特殊函數(shù)、快速傅里葉變換、信號處理和圖像處理、常微分方程求解以及其它科學與工程中常用的計算模塊。
它的功能類似于MATLAB,Scilab和GNUOctave軟件。Python的大多數(shù)機器學習庫都依賴于這兩個模塊,Numpy和Scipy經(jīng)常合并使用。ScientificPython是一組Python程序模塊,用于科學計算,包括幾何(矢量、張量、變換、矢量和張量場),四元數(shù),自動求導,(線性)插值,多項式,基礎統(tǒng)計學,非線性最小二乘擬合,單位計算,F(xiàn)ortran兼容文本格式,通過VRML的3D顯示,以及兩個Tk小工具,分別用于繪制線圖和3D網(wǎng)格模型。
另外還有與netCDF、MPI和BSPlib庫的接口。科學計算庫NumPy提供了矩陣、線性代數(shù)、傅立葉變換等,以及最常用的N維數(shù)組對象。
NumPy提供了兩個基本對象:
N-dimensionalarrayobject)和ufunc(universalfunctionobject)。
ndarray是一個用于存儲單一數(shù)據(jù)類型的多維數(shù)組,ufunc是一個函數(shù),它可以處理該數(shù)組。
計算包最優(yōu)化,可進行線性規(guī)劃,二次規(guī)劃,半正定規(guī)劃等的計算。
科學計算速度優(yōu)化編譯器。Pymvpa2,一個Python工具包,為大數(shù)據(jù)集提供統(tǒng)計學分析,提供一個靈活的可擴展框架。
其主要功能有分類、回歸、特征選擇、導入輸出、可視化等,還提供了復雜網(wǎng)絡優(yōu)化軟件包。Zipline,交易算法的函數(shù)庫
PyDy,Python動態(tài)建模函數(shù)庫。
SymPy,符號數(shù)學的Python庫。statsmodels,Python的統(tǒng)計建模和計量經(jīng)濟學。
astropy,天文學界的Python庫。
orange,橙色,數(shù)據(jù)挖掘,數(shù)據(jù)可視化,通過可視化編程或Python腳本學習機分析。
RDKit,化學信息學和機器學習的軟件。
OpenBabel,巴貝爾,開放的化學工具箱。
cclib,化學軟件包的計算函數(shù)庫。
Biopython,免費的生物計算工具包。
bccb,生物分析相關的代碼集。bcbio-nextgen,提供完全自動化、高通量、測序分析的工具包。
visvis,可視化計算模塊庫,可進行一維到四維數(shù)據(jù)的可視化。
MapReduce是Google提出的一個軟件[架構],用于大規(guī)模數(shù)據(jù)集(大于1TB)的并行運算。
概念“Map(映射)”和“Reduce(歸納)”,及他們的主要思想,都是從函數(shù)式編程語言借來的MapReduce函數(shù)庫。Framworks
andlibrariesforMapReduce.,PySpark,[Spark]的Python
API。dpark,Spark的Python克隆,Python中的MapReduce框架。luigi,為批量工作,建立復雜的管道。mrjob,運行在[Hadoop],或亞馬遜網(wǎng)絡服務的,MapReduce工作。
以上我們介紹了Python大數(shù)據(jù)與科學計算的庫相關知識,如果您想了解更多相關信息,請您繼續(xù)關注中培偉業(yè)。