0
0 Комментариев

На Windows 7 установлены:

Python27 и Python38-32

asn1crypto==0.24.0
attrs==19.1.0
Automat==0.7.0
backports.functools-lru-cache==1.5
beautifulsoup4==4.7.1
bs4==0.0.1
certifi==2019.3.9
cffi==1.12.2
chardet==3.0.4
constantly==15.1.0
cryptography==2.6.1
cssselect==1.0.3
enum34==1.1.6
freeze==1.0.10
hyperlink==18.0.0
idna==2.8
incremental==17.5.0
ipaddress==1.0.22
lxml==4.3.2
pathlib==1.0.1
pyasn1==0.4.5
pyasn1-modules==0.2.4
pycparser==2.19
PyDispatcher==2.0.5
PyHamcrest==1.9.0
pyOpenSSL==19.0.0
queuelib==1.5.0
requests==2.21.0
service-identity==18.1.0
six==1.12.0
soupsieve==1.7.3
urllib3==1.24.1
urlopen==1.0.0
w3lib==1.20.0
zope.interface==4.6.0

=====================

Python38-32

beautifulsoup4==4.7.1
bs4==0.0.1
certifi==2019.3.9
chardet==3.0.4
get==2018.11.19
idna==2.8
pathlib==1.0.1
post==2018.11.20
public==2018.11.20
query-string==2018.11.20
request==2018.11.20
requests==2.21.0
soupsieve==1.8
urllib3==1.24.1
urlopen==1.0.0

=============================

Код html:

Поиск в ютубе: Болонская удочка

Заголовок статьи:

<a id=»video-title» class=»yt-simple-endpoint style-scope ytd-video-renderer» aria-label=»Азбука поплавочной ловли. Болонская удочка Автор: Охотник и рыболов Год назад 13 минут 36&nbsp;615 просмотров» title=»Азбука поплавочной ловли. Болонская удочка» href=»/watch?v=cGNxRFe9sHs»>
Азбука поплавочной ловли. Болонская удочка
</a>
—————————————————————————
Краткое описание видео:

<yt-formatted-string id=»description-text» class=»style-scope ytd-video-renderer»>В этом выпуске речь пойдет о <span class=»bold style-scope yt-formatted-string»>болонской</span> ловле. Какими бывают болонские <span class=»bold style-scope yt-formatted-string»>удочки</span>, какие катушки и оснастки можн…</yt-formatted-string>

Ссылки сохраняются в файл output.txt

Вопрос: Как в ютубе парсер добавить код чтобы сохранялись заголовки и краткое содержание к видео ?

===============================================

Это сам скрипт:

# -*- coding: utf-8 -*-
import urllib
import re, os, sys
from beautifulsoup import beautifulsoup
def findyoutube(x):
    mas=[]
    sq='http://www.youtube.com/results?search_query='+urllib.quote(x)
    doc = urllib.urlopen(sq).read().decode('cp1251',errors='ignore')
    match = re.findall("\?v\=(.+?)\"", doc)
    if not(match is None):
        for ii in match:
            if(len(ii)<25):
                mas.append(ii)
    mas=dict(zip(mas,mas)).values()
    mas2=[]
    for y in mas: mas2.append('http://www.youtube.com/watch?v='+y)
    return mas2
print(findyoutube('болонская+удочка°'))
with open('output.txt', 'w') as output:
    for i in findyoutube('болонская+удочка'):
        output.write(i+'\n')


Добавить комментарий