0
0 Комментариев

Есть два датафрейма trans_train_data и train_labels. train_labels содержит метки классов: 0,1,-1. Нужно удалить все -1 из train_labels и соответствующие строки в trans_train_data. То есть если в train_labels -1 стоит на 3,45 и 78 позиции, то в trans_train_data нужно удалить строки 3,45 и 78. Индексы в данных датафреймах произвольные (то есть не 0,1,2,3… а 98, 45623, 3,64785…)

Пробовала задать новые индексы через .reindex(), но в этом случае появляются NaN и меняется порядок следования элементов.

Так же пробовала через генератор:

generator = enumarate(train_labels)
out = [x: for i,x in generator if x==-1]

Возвращает массив с неправильными индексами.
Подскажите что делать?


Добавить комментарий