薛建波,羅佳
(武漢虹旭信息技術(shù)有限責(zé)任公司, 湖北武漢,430074)
Python是一個(gè)高層次的結(jié)合了解釋性、編譯性、互動(dòng)性和面向?qū)ο蟮哪_本語言。其設(shè)計(jì)具有很強(qiáng)的可讀性,相比其他語言,Python具有特有的語法結(jié)構(gòu)。Python支持廣泛的應(yīng)用程序開發(fā),從簡單的文字處理到web開發(fā),以及數(shù)據(jù)庫操作。Python的特點(diǎn)有以下幾個(gè)方面:Python有相對比較少的關(guān)鍵字,結(jié)構(gòu)簡單,語法定義明確。Python代碼使用空格對齊,更加便于閱讀和理解。每一個(gè)模塊有清晰的定義和調(diào)用說明,在軟件完成以后的維護(hù)很容易。Python的易于學(xué)習(xí)和編寫使其快速地流行。經(jīng)過多年的發(fā)展和標(biāo)準(zhǔn)制定,Python提供了豐富的標(biāo)準(zhǔn)庫。這些庫文件安裝可以通過Python命令進(jìn)行。庫文件的調(diào)用也十分簡單。如果標(biāo)準(zhǔn)庫中沒有目標(biāo)程序源碼,用戶可以自己通過c或者C++自我實(shí)現(xiàn)。也可以通過API對C和C++進(jìn)行調(diào)用。Python支持所有的商業(yè)數(shù)據(jù)庫的數(shù)據(jù)接口,支持GUI編程。提供成熟可靠的的web框架,簡化的web開發(fā)的過程。不同用途或者功能的軟件開發(fā)可能需要不同的語言進(jìn)行編寫。特定的語言提供了良好數(shù)據(jù)操作和簡化后的編程邏輯。而Python提供了當(dāng)前許多不同功能軟件開發(fā)、操作的庫。不同的程序,相同的語言進(jìn)行實(shí)現(xiàn),效率更高,兼容性更好。此外,Python還支持機(jī)器學(xué)習(xí)和創(chuàng)建數(shù)學(xué)模型。
使用Python進(jìn)行混合編程有兩種方式:擴(kuò)展和嵌入。擴(kuò)展是通過C、C++等系統(tǒng)語言實(shí)現(xiàn)Python的功能模塊。嵌入是將Python解釋器加載到應(yīng)用程序中,使程序能夠解釋運(yùn)行Python語言寫成的腳本。兩者都需要調(diào)用C語言應(yīng)用程序接口。
(1)添加/額外的(非Python)功能,提供Python核心功能中沒有提供的部分,比如創(chuàng)建新的數(shù)據(jù)類型或者將Python嵌入到其它已經(jīng)存在的應(yīng)用程序中,則必須進(jìn)行擴(kuò)展編譯。(2)性能瓶頸的效率提升。解釋型語言一般比編譯型語言慢,如果某一個(gè)模塊處理的數(shù)據(jù)比較多,或者會頻繁的操作IO,整個(gè)程序的運(yùn)行速度會降低,形成程序的瓶頸。但是如果將所有的程序都用低級語言編寫,會存在兩個(gè)問題:一是工程量太大,不符合軟件開發(fā)的初衷-高效率;二是有些模塊,Python的運(yùn)行效率與低級語言運(yùn)行效率相差不大,不需要重新編譯。(3)核心代碼加密。因?yàn)镻ython是解釋性語言,源代碼沒有私密性。將核心代碼由Python語言轉(zhuǎn)變?yōu)榫幾g語言就變得很重要。
(1)創(chuàng)建應(yīng)用程序的源代碼。(2)利用樣板來包裝代碼。(3)創(chuàng)建setup.py進(jìn)行編譯,封裝為Python的庫。(4)通過Python解釋器運(yùn)行。
下面以在Linux下面環(huán)境下進(jìn)行文本檢索的實(shí)例,介紹基于Python的混合編程。該程序?qū)崿F(xiàn)了對格式化的文本進(jìn)行檢索,查找關(guān)鍵字,提取出包含關(guān)鍵字的數(shù)據(jù)段。程序運(yùn)行環(huán)境:操作系統(tǒng)-Red Hat 4.4.7-3;編譯器-GCC 4.4.7;Python解釋器-Python 2.6.6。
在頭文件中添加Python.h,里面包含了Python定義的所有的內(nèi)部數(shù)據(jù)結(jié)構(gòu)和C API函數(shù)原型。按照程序邏輯編寫文本處理函數(shù)體。通過GCC編譯其中的主程序。
(1)對照C語言源代碼,在文件中為每個(gè)模塊的每一個(gè)函數(shù)增加PyObject* M_func()的包裝函數(shù)。包裝函數(shù)的目的是把python的值傳遞給c,再把c中函數(shù)的計(jì)算結(jié)果轉(zhuǎn)換成Python對象返回給python。
(2)將每個(gè)模塊增加一個(gè)PyMethodDef ModuleMethods[]的數(shù)組,為Python解釋器提供調(diào)用入口:
(3)增加模塊初始化函數(shù)void initMethod():
(1)編寫setup.py文件。
(2)執(zhí)行setup文件,擴(kuò)展的模塊會被導(dǎo)入至Python的調(diào)用庫。程序執(zhí)行的時(shí)候,解釋器找到模塊的位置,進(jìn)行調(diào)用。
(3)運(yùn)行結(jié)果。在文本中找到的關(guān)鍵字?jǐn)?shù)據(jù),并且提取出了文本段。
在原始的文本數(shù)據(jù)量很大的情況下,擴(kuò)展以后的數(shù)據(jù)檢索速度明顯快于純Python腳本檢索的速度。在此基礎(chǔ)上,加入Python的機(jī)器學(xué)習(xí)的庫文件進(jìn)行程序功能的擴(kuò)展,就能實(shí)現(xiàn)數(shù)據(jù)推薦功能。
人工智能興起帶動(dòng)了Python的發(fā)展。Google開源了Python機(jī)器學(xué)習(xí)源碼,提供大量標(biāo)準(zhǔn)的Python機(jī)器學(xué)習(xí)庫。Python的底層是由C/C++實(shí)現(xiàn)。運(yùn)行速度低于編譯語言。隨著處理的數(shù)據(jù)量越來越大,對程序處理速度要求也會不斷提升?;旌险Z言編程以后肯定會應(yīng)用的更加廣泛。