久久精品国产亚洲高清|精品日韩中文乱码在线|亚洲va中文字幕无码久|伊人久久综合狼伊人久久|亚洲不卡av不卡一区二区|精品久久久久久久蜜臀AV|国产精品19久久久久久不卡|国产男女猛烈视频在线观看麻豆

    1. <style id="76ofp"></style>

      <style id="76ofp"></style>
      <rt id="76ofp"></rt>
      <form id="76ofp"><optgroup id="76ofp"></optgroup></form>
      1. 千鋒教育-做有情懷、有良心、有品質(zhì)的職業(yè)教育機構(gòu)

        手機站
        千鋒教育

        千鋒學習站 | 隨時隨地免費學

        千鋒教育

        掃一掃進入千鋒手機站

        領(lǐng)取全套視頻
        千鋒教育

        關(guān)注千鋒學習站小程序
        隨時隨地免費學習課程

        當前位置:首頁  >  技術(shù)干貨  > ?Python簡單兩步實現(xiàn)天氣爬蟲采集器

        ?Python簡單兩步實現(xiàn)天氣爬蟲采集器

        來源:千鋒教育
        發(fā)布人:xqq
        時間: 2023-11-06 03:54:15 1699214055

        說道爬蟲大家或許感覺非常神秘,其實它沒有我們想象的那么神奇(當然,google和baidu的爬蟲是一場復(fù)雜和強大的,它的強大不是爬蟲本身強大,而是后臺的數(shù)據(jù)處理和數(shù)據(jù)挖掘算法非常強大),今天我們就來揭開它神秘的面紗。呵呵,簡單兩步就可以實現(xiàn)一個網(wǎng)頁天氣爬蟲程序。。。

        爬蟲簡單說來包括兩個部分:1.獲得網(wǎng)頁文本信息。2.數(shù)據(jù)分析,獲取其中我們想要的數(shù)據(jù)。

        1、獲得網(wǎng)頁文本信息。

        python在獲取html方面十分方便,有了urllib庫的幫助,只需要幾行代碼就可以實現(xiàn)我們需要的功能。

        #引入urllib庫

        importurllib

        defgetHtml(url):

        page=urllib.urlopen(url)

        html=page.read()

        page.close()

        returnhtml

        這里返回的就是網(wǎng)頁的源代碼,也就是html代碼。

        那我們?nèi)绾螐闹械玫轿覀兿胍男畔⒛?那就需要用到在網(wǎng)頁分析里面最最常用的工具-正則表達式了。

        2、根據(jù)正則表達式等獲得需要的內(nèi)容。

        使用正則表達式時需要仔細觀察該網(wǎng)頁信息的結(jié)構(gòu),并寫出正確的正則表達式。

        python正則表達式的使用也很簡潔:

        #引入正則表達式庫

        importre

        defgetWeather(html):

        reg='(.*?).*?(.*?).*?(.*?)'

        weatherList=re.compile(reg).findall(html)

        returnweatherList

        說明:

        其中reg是正則表達式,html是第一步獲得的文本。findall的作用是找到html中所有符合正則匹配的字符串并存放到weatherList中。之后再枚舉weatheList中的數(shù)據(jù)輸出即可。

        這里的正則表達式reg有兩個地方要注意。

        一個是“(.*?)”。只要是()中的內(nèi)容都是我們將要獲得的內(nèi)容,如果有多個括號,那么findall的每個結(jié)果就都包含這幾個括號中的內(nèi)容。上面有三個括號,分別對應(yīng)城市、最低溫和最高溫。

        另一個是“.*?”。python的正則匹配默認是貪婪的,即默認盡可能多地匹配字符串。如果在末尾加上問號,則表示非貪婪模式,即盡可能少地匹配字符串。在這里,由于有多個城市的信息需要匹配,所以需要使用非貪婪模式,否則匹配結(jié)果只剩下一個,且是不正確的。

        以上內(nèi)容為大家介紹了Python簡單兩步實現(xiàn)天氣爬蟲采集器,希望對大家有所幫助,如果想要了解更多Python相關(guān)知識,請關(guān)注IT培訓機構(gòu):千鋒教育。http://m.2667701.com/

        tags: python培訓
        聲明:本站稿件版權(quán)均屬千鋒教育所有,未經(jīng)許可不得擅自轉(zhuǎn)載。
        10年以上業(yè)內(nèi)強師集結(jié),手把手帶你蛻變精英
        請您保持通訊暢通,專屬學習老師24小時內(nèi)將與您1V1溝通
        免費領(lǐng)取
        今日已有369人領(lǐng)取成功
        劉同學 138****2860 剛剛成功領(lǐng)取
        王同學 131****2015 剛剛成功領(lǐng)取
        張同學 133****4652 剛剛成功領(lǐng)取
        李同學 135****8607 剛剛成功領(lǐng)取
        楊同學 132****5667 剛剛成功領(lǐng)取
        岳同學 134****6652 剛剛成功領(lǐng)取
        梁同學 157****2950 剛剛成功領(lǐng)取
        劉同學 189****1015 剛剛成功領(lǐng)取
        張同學 155****4678 剛剛成功領(lǐng)取
        鄒同學 139****2907 剛剛成功領(lǐng)取
        董同學 138****2867 剛剛成功領(lǐng)取
        周同學 136****3602 剛剛成功領(lǐng)取
        相關(guān)推薦HOT
        Python標準庫中自帶的單元測試框架

        Unittest是Python標準庫中自帶的單元測試框架,支持自動化測試,測試用例的初始化和關(guān)閉測試用例的聚合等功能。有一些類似于Java中的Junit單元...詳情>>

        2023-11-06 06:57:52
        有Java基礎(chǔ)的學習python應(yīng)該注意些什么

        首先,對于具有Java編程基礎(chǔ)的人來說,學習Python的初期并不會遇到太大的障礙,但是要結(jié)合自己的發(fā)展規(guī)劃來制定學習規(guī)劃,尤其要重視學習方向的...詳情>>

        2023-11-06 06:25:27
        Python 定時修改數(shù)據(jù)庫

        當需要定時修改數(shù)據(jù)庫時,一般我們都選擇起一個定時進程去改庫。如果將這種定時任務(wù)寫入業(yè)務(wù)中,寫成一個接口呢,定時進程顯得有些不太合適?如...詳情>>

        2023-11-06 06:03:51
        Python有哪些常用函數(shù)?

        Python常用函數(shù)有哪些?我想大家都比較好奇這個問題,今天小編特地整理了一篇有關(guān)Python常用函數(shù)的相關(guān)內(nèi)容,接下來我們一起來看看具體的內(nèi)容介...詳情>>

        2023-11-06 05:49:27
        Python常用的三大開源框架

        眾所周知,Python是一種腳本語言,具有易學、語法清晰、易維護等優(yōu)點,而且具有豐富和強大的庫,被稱作為膠水語言。Python語言誕生較早,經(jīng)過多...詳情>>

        2023-11-06 05:35:03
        乐东| 桐柏县| 同心县| 吉安县| 茌平县| 商水县| 陈巴尔虎旗| 田林县| 红安县| 汨罗市| 禹城市| 尼勒克县| 名山县| 双鸭山市| 吕梁市| 瑞丽市| 肇东市| 紫金县| 徐州市| 郴州市| 乌拉特前旗| 古丈县| 大关县| 乌鲁木齐县| 西贡区| 平顶山市| 陇西县| 钦州市| 灵川县| 泰州市| 壶关县| 汝州市| 无锡市| 阳曲县| 炉霍县| 冕宁县| 德兴市| 武安市| 富锦市| 睢宁县| 海城市|