新聞中心
本文和大家重點討論一下用Perl抓取網(wǎng)頁和提交表格的方法,在學習Perl的過程中這些問題是經(jīng)常會遇到的,這里簡單介紹一下用Perl來實現(xiàn)抓好取網(wǎng)頁的源代碼,以及用POST的方法來提交表格,并返回結果。

高碑店ssl適用于網(wǎng)站、小程序/APP、API接口等需要進行數(shù)據(jù)傳輸應用場景,ssl證書未來市場廣闊!成為創(chuàng)新互聯(lián)的ssl證書銷售渠道,可以享受市場價格4-6折優(yōu)惠!如果有意向歡迎電話聯(lián)系或者加微信:028-86922220(備注:SSL證書合作)期待與您的合作!
用Perl抓取網(wǎng)頁和提交表格
這里簡單介紹一下用Perl來實現(xiàn)抓好取網(wǎng)頁的源代碼,以及用POST的方法來提交表格,并返回結果。難的講不來,講講簡單的。
這里講到的Perl模塊有:
useLWP::Simple;useLWP::UserAgent;用Perldoc查看詳細的用法。
1,用Perl抓取網(wǎng)頁
如果只是要拿到某個網(wǎng)頁,那使用LWP::Simple里的函數(shù)是最簡單的。通過調用get($url)函數(shù),就可以得到相關網(wǎng)址的內容。
- my$url='http://freshair.npr.org/dayFA.cfm?todayDate=current'
- useLWP::Simple;
- my$content=get$url;
- die"Couldn'tget$url"unlessdefined$content;
#$content里是網(wǎng)頁內容,下面是對此內容作些分析:
- if($content=~m/jazz/i){
- print"They'retalkingaboutjazztodayonFreshAir!\n";
- }else{
- print"FreshAirisapparentlyjazzlesstoday.\n";
- }
非常簡單易懂。拿網(wǎng)頁內容是容易的,難的是用正則過濾需要的內容。
2,通過POST提交表格
部分HTML表格使用HTMLPOST向服務器提交數(shù)據(jù),在這里你可以這樣:
- $response=$browser->post($url,
- [
- formkey1=>value1,
- formkey2=>value2,
- ...
- ],
- );
實例分析:例如在http://www.enzim.hu/hmmtop/html/submit.html)提交一段序列并返回結果,用Perl來實現(xiàn)。代碼如下:
- #!/usr/bin/Perl
- useLWP::UserAgent;
- my$browser=LWP::UserAgent->new;
- $protein="MSSSTPFDPYALSEHDEERPQNVQSKSRTAELQAEIDDTVGIMRDNINKVAERGERLTSI";
- my$SUSUI_URL="http://www.enzim.hu/hmmtop/server/hmmtop.cgi";
- my$response=$browser->post($SUSUI_URL,['if'=>$protein,]);
- if($response->is_success){
- print$response->content;
- }else{
- print"Badluckthistime\n";
- }
通過分析http://www.enzim.hu/hmmtop/html/submit.html的頁面可知,這個要提交的input只有一個,就是name="if"。$protein就是要提交的序列。$response->content就是返回結果。
【編輯推薦】
- Perl if語句用法實例解析
- Perl文件句柄概念詳解
- 實例解析Perl守護進程用法
- Perl基礎 Perl數(shù)組學習指南
- 術語匯編 Perl變量中Perl關聯(lián)數(shù)組用法解析
文章名稱:實例解析用Perl抓取網(wǎng)頁和提交表格
網(wǎng)站URL:http://m.5511xx.com/article/dppsssp.html


咨詢
建站咨詢
