0
0 комментариев

Есть файл, содержащий строки вида:

user_id,attributes
112,»{«»age»»: 33, «»gender»»: «»F»»}»
113,»{«»age»»: 26, «»gender»»: «»M»»}»

Я читаю этот файл и преобразую attributes в колонки следующим образом:

[apcode language=»python»]

import pandas as pd
import json
 user_attributes_file_name = 'C:\\user_attributes.csv'
user_attributes = pd.read_csv(user_attributes_file_name)
 user_attributes['attributes_lib'] = user_attributes.apply(lambda x: json.loads(x['attributes']), axis =  1)
user_attributes['age'] = user_attributes.apply(lambda x: x['attributes_lib']['age'], axis =  1)
user_attributes['gender'] = user_attributes.apply(lambda x: x['attributes_lib']['gender'], axis =  1)

[/apcode]

Код работает, но проблема в том, что apply слишком медленно работает.

Можно ли как то оптимизировать этот кусок кода?

Asked question
Добавить комментарий