日韩无码专区无码一级三级片|91人人爱网站中日韩无码电影|厨房大战丰满熟妇|AV高清无码在线免费观看|另类AV日韩少妇熟女|中文日本大黄一级黄色片|色情在线视频免费|亚洲成人特黄a片|黄片wwwav色图欧美|欧亚乱色一区二区三区

RELATEED CONSULTING
相關(guān)咨詢
選擇下列產(chǎn)品馬上在線溝通
服務(wù)時(shí)間:8:30-17:00
你可能遇到了下面的問(wèn)題
關(guān)閉右側(cè)工具欄

新聞中心

這里有您想知道的互聯(lián)網(wǎng)營(yíng)銷解決方案
與Python的速度較量:C++究竟有多快?

本文轉(zhuǎn)載自公眾號(hào)“讀芯術(shù)”(ID:AI_Discovery)。

創(chuàng)新互聯(lián)是一家集網(wǎng)站建設(shè),許昌企業(yè)網(wǎng)站建設(shè),許昌品牌網(wǎng)站建設(shè),網(wǎng)站定制,許昌網(wǎng)站建設(shè)報(bào)價(jià),網(wǎng)絡(luò)營(yíng)銷,網(wǎng)絡(luò)優(yōu)化,許昌網(wǎng)站推廣為一體的創(chuàng)新建站企業(yè),幫助傳統(tǒng)企業(yè)提升企業(yè)形象加強(qiáng)企業(yè)競(jìng)爭(zhēng)力??沙浞譂M足這一群體相比中小企業(yè)更為豐富、高端、多元的互聯(lián)網(wǎng)需求。同時(shí)我們時(shí)刻保持專業(yè)、時(shí)尚、前沿,時(shí)刻以成就客戶成長(zhǎng)自我,堅(jiān)持不斷學(xué)習(xí)、思考、沉淀、凈化自己,讓我們?yōu)楦嗟钠髽I(yè)打造出實(shí)用型網(wǎng)站。

對(duì)于數(shù)據(jù)科學(xué)家而言,熱愛Python的理由數(shù)不勝數(shù)。但你是否也曾問(wèn)過(guò)這樣的問(wèn)題:Python和C或C++等更專業(yè)的低級(jí)編程語(yǔ)言究竟有何不同呢?我想這是很多數(shù)據(jù)科學(xué)家或者Python用戶曾經(jīng)問(wèn)過(guò)或者將來(lái)會(huì)問(wèn)自己的問(wèn)題。

Python和C++類語(yǔ)言之間存在許多區(qū)別,本文將通過(guò)一個(gè)十分簡(jiǎn)單的例子向你展示,與Python相比,C++究竟有多快。

為了說(shuō)明這種區(qū)別,本文選擇一個(gè)簡(jiǎn)單實(shí)用而非想象虛構(gòu)的任務(wù):生成固定值為“k”的所有可能DNA k-mers。選擇該示例,是因?yàn)榕c基因組相關(guān)的許多數(shù)據(jù)處理和任務(wù)分析(例如k-mers生成)都是計(jì)算密集型的,而這同樣也是很多生物信息學(xué)領(lǐng)域的數(shù)據(jù)科學(xué)家對(duì)C++感興趣的原因。

請(qǐng)注意,本文目標(biāo)并不是以最有效的方式比較C++和Python。這兩種代碼均可采用更高效的方式和更優(yōu)化的方法編寫。本文的唯一目標(biāo),就是比較這兩種語(yǔ)言在使用完全相同的算法和指令時(shí)的速度。

DNA K-mers簡(jiǎn)介

DNA是一種稱為核苷酸的長(zhǎng)鏈單位。在DNA中,共有4種核苷酸類型,分別用字母A、C、G和T表示。人類(更準(zhǔn)確地說(shuō)是智人)擁有核苷酸對(duì)30億個(gè)。例如,人類DNA的一小部分可能類似于:

ACTAGGGATCATGAAGATAATGTTGGTGTTTGTATGGTTTTCAGACAATT

在此示例中,如果從該字符串中選擇任意4個(gè)連續(xù)的核苷酸(即字母),它將是一個(gè)長(zhǎng)度為4的k-mer(可稱之為4-mer)。以下便是從此示例中衍生出來(lái)的一些4-mers例子:ACTA,CTAG,TAGG,AGGG,GGGA等。

難點(diǎn)挑戰(zhàn)

本文以生成所有可能的13-mers為例,從數(shù)學(xué)上講,這是一個(gè)帶有替換的排列問(wèn)題。因此,共有413個(gè)(67108864)可能的13-mers。下面將使用一個(gè)簡(jiǎn)單的算法在C++和Python中生成結(jié)果。

方案比較

為了方便比較C++和Python在此特定挑戰(zhàn)中的優(yōu)劣,我在兩種語(yǔ)言中使用了完全相同的算法。這兩種代碼均有意設(shè)計(jì)地簡(jiǎn)單而相似。同時(shí),避免使用復(fù)雜的數(shù)據(jù)結(jié)構(gòu)或第三方包或庫(kù)。第一段代碼采用Python編寫。

 
 
 
 
  1. defconvert(c):
  2.                if (c =='A'): return'C'
  3.                if (c =='C'): return'G'
  4.                if (c =='G'): return'T'
  5.                if (c =='T'): return'A'
  6.              print("Start")
  7.              opt ="ACGT"
  8.             s =""
  9.             s_last =""
  10.             len_str =13
  11.              for i inrange(len_str):
  12.                s += opt[0]
  13.              for i inrange(len_str):
  14.                s_last += opt[-1]
  15.              pos =0
  16.             counter =1
  17.             while (s != s_last):
  18.                counter +=1
  19.                # You can uncomment the next line to see all k-mers.
  20.                # print(s)
  21.                change_next =True
  22.                for i inrange(len_str):
  23.                     if (change_next):
  24.                         if (s[i] == opt[-1]):
  25.                             ss = s[:i] +convert(s[i]) + s[i+1:]
  26.                             change_next =True
  27.                         else:
  28.                             ss = s[:i] +convert(s[i]) + s[i+1:]
  29.                             break
  30.              # You canuncomment the next line to see all k-mers.
  31.             # print(s)
  32.             print("Number ofgenerated k-mers: {}".format(counter))
  33.             print("Finish!")

運(yùn)行Python代碼,生成全部13-mers共6700萬(wàn)個(gè)大約需要61.23秒。為了公平比較,我注釋掉了顯示k-mers的行。如果想在生成k-mers時(shí)顯示它們,也可以取消對(duì)這兩行的注釋。注意,顯示全部k-mers耗時(shí)很長(zhǎng)。如有需要,請(qǐng)操作CTRL+C中止代碼。

現(xiàn)在,來(lái)看看C++中同樣的算法:

 
 
 
 
  1. #include
  2.            #include
  3.              usingnamespacestd;
  4.              charconvert(char c)
  5.            {
  6.               if (c == 'A') return'C';
  7.               if (c == 'C') return'G';
  8.               if (c == 'G') return'T';
  9.               if (c == 'T') return'A';
  10.               return' ';
  11.            }
  12.              intmain()
  13.            {
  14.               cout << "Start" << endl;
  15.                  string opt = "ACGT";
  16.               string s = "";
  17.               string s_last = "";
  18.               int len_str = 13;
  19.               bool change_next;
  20.                  for (int i=0; i
  21.               {
  22.                    s += opt[0];
  23.               }
  24.                  for (int i=0; i
  25.               {
  26.                    s_last += opt.back();
  27.               }
  28.                  int pos = 0;
  29.               int counter = 1;
  30.               while (s != s_last)
  31.               {  
  32.                    counter ++;
  33.                    // You canuncomment the next line to see all k-mers.
  34.                    // cout << s<< endl; 
  35.                    change_next = true;
  36.                    for (int i=0; i
  37.                    {
  38.                        if (change_next)
  39.                        {
  40.                            if (s[i] == opt.back())
  41.                            {
  42.                                s[i] = convert(s[i]);
  43.                                change_next = true;
  44.                            } else {
  45.                                s[i] = convert(s[i]);
  46.                                break;
  47.                            }
  48.                        }
  49.                    }
  50.               }
  51.                  // You can uncomment the next line tosee all k-mers.
  52.               // cout << s << endl;
  53.               cout << "Number of generated k-mers: " <
  54.               cout << "Finish!" << endl;
  55.               return0;
  56.            }

編譯后,運(yùn)行C++代碼,生成全部13-mers共6700萬(wàn)個(gè)大約需要2.42秒。這意味著運(yùn)行相同算法,Python用時(shí)是C++的25倍多。然后,對(duì)14-mers和15-mers重復(fù)進(jìn)行此實(shí)驗(yàn)。匯總結(jié)果如下表所示:

比較生成13-、14-和15-mers的Python和C++運(yùn)行結(jié)果。

顯然,C++比Python快得多。對(duì)于大多數(shù)程序員和數(shù)據(jù)科學(xué)家而言,這是共識(shí)。但該示例表明,這種差異十分顯著。

本示例并沒(méi)有使用CPU或GPU并行化,因其必須針對(duì)相應(yīng)類型的問(wèn)題(密集并行難題)進(jìn)行。此外,示例也沒(méi)有大量涉及內(nèi)存。如果將運(yùn)行結(jié)果進(jìn)行存儲(chǔ)(出于某些特定原因),那么使用內(nèi)存管理在運(yùn)行C++和Python時(shí),將產(chǎn)生更顯著的差異。

此示例和數(shù)以千計(jì)的其他事實(shí)表明,在處理大量數(shù)據(jù)或指數(shù)增長(zhǎng)的過(guò)程中,身為數(shù)據(jù)科學(xué)家,你應(yīng)該了解C++類語(yǔ)言。


標(biāo)題名稱:與Python的速度較量:C++究竟有多快?
URL標(biāo)題:http://m.5511xx.com/article/djjjicj.html