0
0 комментариев

Здравствуйте, надо из текстового файла извлечь все таймзоны[tz], где есть слово «Africa», получилось извлечь всей таймзоны(в другой программе), теперь надо чисто с Африкой)

Пример строки

{ «a»: «Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; WOW64;
Trident/5.0)», «c»: «ES», «nk»: 0, «tz»: «Africa/Ceuta», «gr»: «51»,
«g»: «zQ95Hi», «h»: «ytZYWR», «l»: «jplnews», «al»: «es-ES», «hh»:
«bitly.com», «r»: «http://www.facebook.com/», «u»:
«http://voyager.jpl.nasa.gov/imagesvideo/uranus.html», «t»:
1331923265, «hc»: 1331670549, «cy»: «Alcal», «ll»: [ 37.516701,
-5.983300 ] }

from pandas import DataFrame, Series
import pandas as pd
import matplotlib.pyplot as plt
import json
from collections import Counter
import numpy as np
import re
 
path='Test.txt'
open(path).readline()
records= [json.loads(line) for  line in open(path)]
time_zones = [rec['tz'] for rec in records if 'tz' in  rec]
 
counts = Counter(time_zones)
ag_counts_africa = str(time_zones)
result = re.findall(r'Africa', ag_counts_africa)
print (result)
 
time_zones_africa = [rec for rec in result if ag_counts_africa in  rec]
print(time_zones_africa)


Добавить комментарий