午夜视频免费看_日韩三级电影网站_国产精品久久一级_亚洲一级在线播放_人妻体内射精一区二区三区_91夜夜揉人人捏人人添红杏_91福利在线导航_国产又粗又猛又黄又爽无遮挡_欧美日韩一区在线播放_中文字幕一区二区三区四区不卡 _日日夜夜精品视频免费观看_欧美韩日一区二区三区

主頁(yè) > 知識(shí)庫(kù) > python實(shí)現(xiàn)csdn全部博文下載并轉(zhuǎn)PDF

python實(shí)現(xiàn)csdn全部博文下載并轉(zhuǎn)PDF

熱門標(biāo)簽:聊城語(yǔ)音外呼系統(tǒng) 海外網(wǎng)吧地圖標(biāo)注注冊(cè) 南陽(yáng)打電話機(jī)器人 孝感營(yíng)銷電話機(jī)器人效果怎么樣 ai電銷機(jī)器人的優(yōu)勢(shì) 商家地圖標(biāo)注海報(bào) 地圖標(biāo)注自己和別人標(biāo)注區(qū)別 打電話機(jī)器人營(yíng)銷 騰訊地圖標(biāo)注沒法顯示

我們學(xué)習(xí)編程,在學(xué)習(xí)的時(shí)候,會(huì)有想把有用的知識(shí)點(diǎn)保存下來,我們可以把知識(shí)點(diǎn)的內(nèi)容爬下來轉(zhuǎn)變成pdf格式,方便我們拿手機(jī)可以閑時(shí)翻看,是很方便的

先來一個(gè)單個(gè)的博文下載轉(zhuǎn)pdf格式的操作


python中將html轉(zhuǎn)化為pdf的常用工具是Wkhtmltopdf工具包,在python環(huán)境下,pdfkit是這個(gè)工具包的封裝類。如何使用pdfkit以及如何配置呢?分如下幾個(gè)步驟。

下載wkhtmltopdf安裝包,并且安裝到電腦上。
下載地址:https://wkhtmltopdf.org/downloads.html

我下的是這個(gè)版本,安裝的時(shí)候要記住路徑,之后調(diào)用要用到路徑

開發(fā)工具

  • python
  • pycharm
  • pdfkit (pip install pdfkit)
  • lxml

今天目標(biāo):博主的全部博文下載,并且轉(zhuǎn)pdf格式保存

基本思路:

1、url + headers
2、分析網(wǎng)頁(yè): CSDN網(wǎng)頁(yè)是靜態(tài)網(wǎng)頁(yè), 請(qǐng)求獲取網(wǎng)頁(yè)源代碼
3、lxml解析獲取boke_urls, author_name
4、循環(huán)遍歷,得到 boke_url
5、xpath解析獲取文件名
6、css選擇器獲取標(biāo)簽文本的主體
7、構(gòu)造拼接html文件
8、保存html文件
9、文件的轉(zhuǎn)換

分析網(wǎng)頁(yè): CSDN網(wǎng)頁(yè)是靜態(tài)網(wǎng)頁(yè), 請(qǐng)求獲取網(wǎng)頁(yè)源代碼
start_url =“https://i1bit.blog.csdn.net/” 為例
確定網(wǎng)址為同步加載


css選擇器獲取標(biāo)簽文本的主體為代碼要點(diǎn)部分
css語(yǔ)法部分

# css選擇器獲取標(biāo)簽文本的主體
        html_css = parsel.Selector(response_2)
        html_content = html_css.css('article').get()
# 構(gòu)造拼接html文件
        html = \

            '''
                !DOCTYPE html>
                    html lang="en">
                    head>
                        meta charset="UTF-8">
                        title>Title/title>
                    /head>
                    body>
                        {}
                    /body>
                /html>
            '''.format(html_content)

點(diǎn)開博主的一篇博文打開開發(fā)者工具

# css選擇器獲取標(biāo)簽文本的主體
        html_css = parsel.Selector(response_2)
        html_content = html_css.css('article').get()
# 構(gòu)造拼接html文件
        html = \

            '''
                !DOCTYPE html>
                    html lang="en">
                    head>
                        meta charset="UTF-8">
                        title>Title/title>
                    /head>
                    body>
                        {}
                    /body>
                /html>
            '''.format(html_content)

文件的轉(zhuǎn)換

   config = pdfkit.configuration(wkhtmltopdf=r'這里為下載wkhtmltopdf.exe的路徑')
            pdfkit.from_file(
                第一個(gè)參數(shù)要轉(zhuǎn)變的html文件,
                第二個(gè)參數(shù)轉(zhuǎn)變后的pdf文件,
                configuration=config
            ) 
            # 上面這樣寫清楚一點(diǎn),也可以直接
            pdfkit.from_file(
                第一個(gè)參數(shù)要轉(zhuǎn)變的html文件,
                第二個(gè)參數(shù)轉(zhuǎn)變后的pdf文件,
            configuration=pdfkit.configuration(wkhtmltopdf=r'這里為下載wkhtmltopdf.exe的路徑')
            )

源碼展示:

import parsel, os, pdfkit
from lxml import etree
from requests_html import HTMLSession
session = HTMLSession()



def main():
    # 1、url + headers
    start_url = input(r'請(qǐng)輸入csdn博主的地址:')
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 '
                      '(KHTML, like Gecko) Chrome/84.0.4147.105 Safari/537.36'
    }

    # 2、分析網(wǎng)頁(yè): CSDN網(wǎng)頁(yè)是靜態(tài)網(wǎng)頁(yè), 請(qǐng)求獲取網(wǎng)頁(yè)源代碼
    response_1 = session.get(start_url, headers=headers).text


    # 3、解析獲取boke_urls, author_name
    html_xpath_1 = etree.HTML(response_1)

    author_name = html_xpath_1.xpath(r'//*[@id="floor-user-profile_485"]/div/div[1]/div[2]/div[2]/div[1]/div[1]/text()')[0]

    boke_urls = html_xpath_1.xpath(r'//article[@class="blog-list-box"]/a/@href')


    # 4、循環(huán)遍歷,得到 boke_url
    for boke_url in boke_urls:

        # 5、請(qǐng)求
        response_2 = session.get(boke_url, headers=headers).text

        # 6、xpath解析獲取文件名
        html_xpath_2 = etree.HTML(response_2)
        file_name = html_xpath_2.xpath(r'//h1[@id="articleContentId"]/text()')[0]


        # 7、css選擇器獲取標(biāo)簽文本的主體
        html_css = parsel.Selector(response_2)
        html_content = html_css.css('article').get()

        # 8、構(gòu)造拼接html文件
        html = \

            '''
                !DOCTYPE html>
                    html lang="en">
                    head>
                        meta charset="UTF-8">
                        title>Title/title>
                    /head>
                    body>
                        {}
                    /body>
                /html>
            '''.format(html_content)

        # 9、創(chuàng)建兩個(gè)文件夾, 一個(gè)用來保存html 一個(gè)用來保存pdf文件
        if not os.path.exists(r'{}-html'.format(author_name)):
            os.mkdir(r'{}-html'.format(author_name))

        if not os.path.exists(r'{}-pdf'.format(author_name)):
            os.mkdir(r'{}-pdf'.format(author_name))

        # 10、保存html文件
        try:
            with open(r'{}-html/{}.html'.format(author_name, file_name), 'w', encoding='utf-8') as f:
                f.write(html)
        except Exception as e:
            print('文件名錯(cuò)誤')

        # 11、文件的轉(zhuǎn)換
        try:
            config = pdfkit.configuration(wkhtmltopdf=r'C:\Program Files\wkhtmltopdf\bin\wkhtmltopdf.exe')
            pdfkit.from_file(
                '{}-html/{}.html'.format(author_name, file_name),
                '{}-pdf/{}.pdf'.format(author_name, file_name),
                configuration=config
            )
            a = print(r'--文件下載成功:{}.pdf'.format(file_name))

        except Exception as e:
            continue


if __name__ == '__main__':
   main()

代碼操作:

到此這篇關(guān)于python實(shí)現(xiàn)csdn全部博文下載并轉(zhuǎn)PDF的文章就介紹到這了,更多相關(guān)python 博文下載并轉(zhuǎn)PDF內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • python解析PDF程序代碼
  • Python合并多張圖片成PDF
  • Python提取PDF指定內(nèi)容并生成新文件
  • 詳解用Python把PDF轉(zhuǎn)為Word方法總結(jié)
  • python操作mysql、excel、pdf的示例
  • python pdfkit 中文亂碼問題的解決方案
  • python 三種方法提取pdf中的圖片
  • Python實(shí)現(xiàn)給PDF添加水印的方法
  • Python讀取pdf表格寫入excel的方法
  • Python 多張圖片合并成一個(gè)pdf的參考示例

標(biāo)簽:南寧 撫州 六盤水 聊城 揚(yáng)州 迪慶 楊凌 牡丹江

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《python實(shí)現(xiàn)csdn全部博文下載并轉(zhuǎn)PDF》,本文關(guān)鍵詞  python,實(shí)現(xiàn),csdn,全部,博文,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無(wú)關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《python實(shí)現(xiàn)csdn全部博文下載并轉(zhuǎn)PDF》相關(guān)的同類信息!
  • 本頁(yè)收集關(guān)于python實(shí)現(xiàn)csdn全部博文下載并轉(zhuǎn)PDF的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    亚洲精品久久久久久下一站| 亚洲综合日韩在线| 亚洲日本精品国产第一区| 日本少妇高潮喷水视频| 国产小视频在线看| 成人av免费在线观看| 日韩人在线观看| 色妞欧美日韩在线| 亚洲一区二区三区欧美| 欧美丰满老妇熟乱xxxxyyy| 亚洲国产精品久久久久爰性色| 成人av第一页| 91精品国产综合久久香蕉麻豆| 欧美激情精品久久久| 日韩欧美一区二区三区久久婷婷| 熟女少妇内射日韩亚洲| 国产精品18在线| 六月丁香综合网| 一区二区三区欧美在线观看| 精品国产一区二区三区久久久 | 男人天堂网在线视频| 亚洲黄色性网站| 亚洲最大在线视频| 国产香蕉一区二区三区| 久久精品在线观看视频| 99视频一区二区| 中文字幕亚洲专区| 欧美二级三级| 午夜理伦三级做爰电影| 国产综合色在线| 欧美一区二区日韩| 欧美深深色噜噜狠狠yyy| 久久高清无码视频| 亚洲免费色视频| 日本一区二区三区在线播放| 成人亚洲精品777777大片| 好吊视频一二三区| 日韩精品综合一本久道在线视频| 日韩欧美视频第二区| 日本高清一二三区| 国产精品久久久久久久久动漫| 久久国产精品久久久久久| 中文av一区二区三区| 国产乱淫a∨片免费观看| 一区二区三区在线免费观看 | 精品久久久久亚洲| 久久精品国产亚洲av无码娇色| jlzzjlzz国产精品久久| 久久久久中文字幕2018| 亚洲第一中文av| 成人午夜视频一区二区播放| 精品视频在线看| 亚洲精品国产精品国自产| 久久精品视频2| 亚洲国产一区二区三区| 国产伦精品一区二区三| 4438国产精品一区二区| 婷婷中文字幕一区三区| 九九99玖玖| 最新国产中文字幕| 婷婷开心激情综合| 蜜桃av色综合| 国产精品久久婷婷| 亚洲电影av在线| 久久美女福利视频| 天天综合永久入口| 色99之美女主播在线视频| 精品久久久久久无码国产| 激情综合网av| 久久国产精品亚洲| 国产福利在线观看视频| 欧美国产在线观看| 国产精品久久综合av爱欲tv| 国产又粗又猛又爽又黄的视频四季| 亚洲乱码一区二区三区在线观看| 久久99精品久久久久久秒播放器 | 91在线视频播放| 成人网在线免费观看| www.国产成人| 日韩精品资源二区在线| 91av俱乐部| 日韩xxx视频| 欧美香蕉大胸在线视频观看| 成人国产在线激情| 1级黄色大片儿| 欧美日韩国产天堂| www国产无套内射com| 亚洲女同志亚洲女同女播放| 亚洲午夜未满十八勿入免费观看全集 | 欧美日韩在线不卡视频| 国产白丝网站精品污在线入口| 欧美激情18p| 疯狂试爱三2浴室激情视频| 欧美日韩视频在线第一区 | 国产精品黄色av| 亚洲 欧美 中文字幕| 亚洲国产精品电影在线观看| 无码内射中文字幕岛国片| av不卡一区二区三区| 国产精品二区在线观看| 精品乱码一区内射人妻无码 | 黄色片视频免费| 精品国产91久久久久久久妲己| 国产91在线免费观看| 亚洲男帅同性gay1069| 丝袜足脚交91精品| 无码精品在线观看| 欧美激情在线有限公司| 日韩精品久久久久久久| 亚洲色图第一页| 国产精品av久久久久久无| 在线日韩一区二区| 在线观看亚洲色图| 国产精品视频一二| 日本一区视频在线| 精品一区二区三区久久| 奇米影视亚洲狠狠色| 中文字幕一区二区三区波野结| 亚洲免费影视第一页| 男男做爰猛烈叫床爽爽小说| 欧美三级视频在线观看| 成年人看片网站| 欧美日韩在线免费观看| 可以在线看的av网站| 国产精品久久精品日日| 麻豆成人小视频| 亚洲欧美色视频| 亚洲xxx自由成熟| 久久只有精品| 99热国产免费| 香港一级纯黄大片| 日本成人在线视频网址| 一级黄色片视频| 国产精品久久久久久久久久久久久久| 人人妻人人爽人人澡人人精品 | 久久91精品国产91久久久| 日韩欧美一级视频| 精品少妇一区二区30p| 久久久久久久久久久影院| 8x海外华人永久免费日韩内陆视频| 亚洲手机在线观看| 日韩在线视频导航| 日韩免费av网站| 97在线日本国产| 国模私拍一区二区| 91精品国产91久久久久久最新| 国产免费无遮挡| 国产精品久久久久久久久久尿| 97久久人国产精品婷婷| 成人看片人aa| 久久99久久99| 国产三级中文字幕| 成人精品国产福利| 亚洲一区精彩视频| 国产精品麻豆网站| 一本色道久久亚洲综合精品蜜桃| 亚洲综合免费观看高清完整版 | 亚洲成人av一区二区三区| 91蝌蚪视频在线| 日韩欧美的一区二区| 久久爱一区二区| 一区二区三区四区精品| 中国a一片一级一片| 国产精品吊钟奶在线| 国产一区二区三区精品欧美日韩一区二区三区 | 国产精品高潮呻吟视频| 性一交一乱一乱一视频| 久久影院理伦片| 91亚洲资源网| 日韩免费视频播放| 91精品国产品国语在线不卡| 91高清免费观看| 欧美精品videossex性护士| 奇米一区二区三区| 久久这里只有精品18| 欧美三级中文字| 丝袜美腿小色网| 欧美大片va欧美在线播放| 狠狠人妻久久久久久综合麻豆| 中文字幕欧美日韩一区二区三区 | 久热99视频在线观看| 精品久久无码中文字幕| 日韩国产高清一区| 中文字幕在线一区| 免费观看污网站| 亚洲免费av电影| 中文字幕人妻互换av久久| 蜜桃狠狠色伊人亚洲综合网站| 亚洲视频小说图片| 亚洲熟妇无码av| 欧美亚洲在线观看| 久久综合国产精品| 一级黄色免费毛片| 欧美大片欧美激情性色a∨久久| 久久五月激情| 肉大捧一出免费观看网站在线播放| 欧美丝袜一区二区| 国产精品久久久久久久久久久久久久久久久 | 欧美激情二区三区| 久草中文综合在线| 99热这里只有精品在线播放| 色综久久综合桃花网| 青青国产91久久久久久 | 偷拍亚洲欧洲综合| 好吊色在线视频| 欧美影视一区二区| 欧美日韩三级一区| 国产精品主播一区二区| 欧美 日韩 国产精品| 日韩精品在线第一页| 蜜臀av一区二区在线免费观看| 奇米影视四色在线| 久久久亚洲精选| 久久综合九色综合欧美亚洲| 亚洲a∨无码无在线观看| 成人av资源网| 欧美人xxxx| 精品人妻av一区二区三区| 鲁一鲁一鲁一鲁一色| 久久人人爽人人爽爽久久| 成人黄色在线看| 噜噜噜在线视频| 蜜桃视频日韩| 国产精品成人免费在线| 一区二区三区免费在线观看视频 | 色wwwwww| 成人不卡免费视频| 国产精品久久久久久久久久尿| 精品日韩视频在线观看| 国产免费的av| 一个色综合久久| 97热在线精品视频在线观看| 亚洲免费在线观看| 黄色片视频网站| 2018日日夜夜| 久久精品最新地址| 国产欧美日韩精品a在线观看| 青娱乐国产在线| 日本一区二区三区视频免费看| 在线播放中文一区| 无码国产精品高潮久久99| 亚洲欧美久久久久| 日韩女在线观看| 在线影院国内精品| 九色porny丨国产精品| 男人的天堂av网| 中文字幕日韩精品久久| 久久躁狠狠躁夜夜爽| 一区二区三区在线视频免费观看| 欧美亚韩一区二区三区| 天堂va久久久噜噜噜久久va| 精品国产依人香蕉在线精品| 成人免费小视频| www夜片内射视频日韩精品成人| 国产精品19p| 国产66精品久久久久999小说 | 日韩欧美国产小视频| 91在线码无精品| 天天综合久久综合| 国产精品拍拍拍| 国产精品久久久久久久久久新婚 | 欧美亚洲成人网| 第一福利永久视频精品| 老色鬼精品视频在线观看播放| 丝袜美腿小色网| 久久久久久久久久久免费视频| 91日韩在线播放| 精品卡一卡二卡三卡四在线| 99久久综合精品| 国产精选久久久| 水蜜桃av无码| 亚洲精品一区二区三区四区五区| 国内精品国产三级国产在线专| 在线亚洲高清视频| 国产精品一区二区在线观看不卡| 日韩一级片大全| 亚洲最大天堂网| 久久涩涩网站| 2019亚洲日韩新视频| 亚洲第一色在线| 亚洲一区在线观看视频| 精品一区二区在线播放| 1级黄色大片儿| 青青草原国产在线视频| 国产偷国产偷亚洲高清97cao| 亚洲午夜精品视频| 一区二区三区精品在线观看| 国产精品影视天天线| 最近中文字幕免费在线观看| 国产草草浮力影院| 自慰无码一区二区三区| 成人国产在线视频| 久久91亚洲精品中文字幕| 精品欧美一区二区久久| 国产精品久线在线观看| 国产一区二区剧情av在线| 黄色污污网站在线观看| 玖玖爱在线精品视频| 东京热加勒比无码少妇| 国产一区免费视频| 欧美极品少妇xxxxⅹ免费视频 | 国产.精品.日韩.另类.中文.在线.播放| 国产在线综合网| 添女人荫蒂视频| 最新天堂在线视频| 久色视频在线播放| 亚洲精品一品区二品区三品区 | 国产在线一区观看| 肥臀熟女一区二区三区| 久久精品无码av| 欧美一区二区三区成人精品| 天堂av在线8| av一区二区三区免费观看| 国产在线精品一区免费香蕉 | 日韩中文字幕在线视频| 一级日本不卡的影视| 国产美女娇喘av呻吟久久| 韩国中文字幕hd久久精品| 999视频在线| 国产67194| 午夜时刻免费入口| 国产国语性生话播放| 免费不卡的av| 青娱乐精品在线| 亚洲性生活网站| 免费看毛片的网址| 日韩精品第1页| 精品乱码一区| 91欧美精品成人综合在线观看| 日韩美女在线看| 97超碰国产精品女人人人爽 | 成人国产精品色哟哟| 国产精品久久久久久久久久三级 | 亚洲自拍偷拍一区二区三区| 成人欧美一区二区三区在线湿哒哒| 欧美在线视频观看| 久久人91精品久久久久久不卡| 日韩在线观看免费av| 亚洲精品狠狠操| 亚洲欧美www| 国产亚洲欧美aaaa| 色综合亚洲精品激情狠狠| 精品国内亚洲在观看18黄 | 欧美少妇一区| 免费一区二区三区在在线视频| 蜜桃视频日韩| 亚洲成人网上| 欧美h视频在线观看| 少妇特黄a一区二区三区 | 国产精品久久久一区二区三区| av资源一区二区| 久久综合一区| 欧美日韩电影一区二区三区| 国产在线精品一区二区三区| 久久国产精品久久精品国产| 日本高清一区| 91视频 - 88av| www.av中文字幕| 日韩视频第二页| 天堂视频免费看| 久久久无码人妻精品无码| 无码人妻精品一区二区中文| 日本美女bbw| 日本特黄一级片| 国产富婆一级全黄大片| 久久99国内精品| 国内欧美视频一区二区| av不卡一区二区三区| 972aa.com艺术欧美| 国产精品色呦呦| 国产精品国产三级国产aⅴ中文 | 日韩欧美中文视频| 人妻无码一区二区三区免费| 91视频免费在观看| 久久精品99国产精| 国产嫩bbwbbw高潮| 中文字幕无码乱码人妻日韩精品| 无码国产精品高潮久久99| 国产自产高清不卡| 亚洲欧洲精品天堂一级| 欧美综合色免费| 精品国产成人在线影院| 久久精品视频va| 日本午夜人人精品| 欧美精品一区三区在线观看| 日韩精品在线视频免费观看| 久久99爱视频| 丁香花五月婷婷| 黄色在线免费观看| 午夜精品久久久久久久99| 日本不卡中文字幕| 国产精品久久久久久久岛一牛影视 | 中文字幕欧美日韩一区二区| 美女日批在线观看| 久久无码精品丰满人妻| 神马午夜精品95| 中文字幕欧美激情| 91福利在线免费观看| 亚洲性线免费观看视频成熟| 午夜免费日韩视频| 日本一区视频在线观看免费| 国产三级精品三级在线| 国产污片在线观看| 久久电影网电视剧免费观看| 亚洲欧洲精品成人久久奇米网| 亚洲第一区在线观看| 国产精品入口日韩视频大尺度| 亚洲精品成人三区| 欧美丰满少妇人妻精品| 久久久久久不卡|