| import numpy as np | |
| from vectorization import model, spotify_data | |
| # Funci贸n para convertir una canci贸n en un vector promedio de sus palabras | |
| def song_vector(tokens, model): | |
| # Filtrar palabras que est谩n en el modelo | |
| tokens = [word for word in tokens if word in model.wv.key_to_index] | |
| if len(tokens) == 0: | |
| return np.zeros(model.vector_size) | |
| # Calcular el promedio de los vectores de las palabras | |
| song_vec = np.mean([model.wv[word] for word in tokens], axis=0) | |
| return song_vec | |
| # Aplicar esta funci贸n a cada canci贸n en tu dataset | |
| spotify_data['song_vector'] = spotify_data['cleaned_text'].apply(lambda x: song_vector(x, model)) | |
| spotify_data.to_csv('dataset_modificado.csv', index=False) | |