Ciao di nuovo
Questa linea di codice è incompleta e suppongo che si completi con .loc[1241]. Se ho ragione questa linea causa l'errore. Se vuoi cercare una specifica row attraverso un indice numerico, non devi usare loc ma iloc.
Tutto questo codice può essere reso molto più semplice usando l'intersezione tra i sets. Eccoti un esempio:
Il set da con le parole chiave ("set_chiavi") lo puoi anche estrapolare dal file in questione con un readlines. Inoltre ti consiglio di mettere in maiuscolo (o minuscolo) tutte le parole che su cui stai eseguendo la ricerca e le parole chiave, questo fa in modo che ci sia il riscontro anche quando le lettere maiuscole e minuscole non coincidono.
Questo metodo sopra non riesce a cercare parole che contengano più spazi, come "università degli studi di torino", ma è qualcosa che si può sistemare con qualche linea di codice ma pensa prima a far funzionare la versione più basilare.
Spero di averti dato almeno un punto su cui partire.
Python:
words = frame["Cleaned Text into list"].loc
Questa linea di codice è incompleta e suppongo che si completi con .loc[1241]. Se ho ragione questa linea causa l'errore. Se vuoi cercare una specifica row attraverso un indice numerico, non devi usare loc ma iloc.
Python:
if_contains = ['one', 'Timone', 'Tisix','Two eight nine']
save = []
words = ['one', 'five', 'Tisix', 'two eight nine']
for word in words:
if word in if_contains:
save.append(word)
print(save)
Tutto questo codice può essere reso molto più semplice usando l'intersezione tra i sets. Eccoti un esempio:
Python:
# Inserisci la stringa su cui eseguire la ricerca e trasformala in set
stringa = "Ciao io sono giorgio"
set_ricerca = set(stringa.split(" "))
# Ipotizziamo tu voglia cercare queste due parole
set_chiavi = {"ciao", "Giorgio"}
# Nota come per via delle maiuscole e minuscole non concordanti il riscontro non troverebbe le parole inserite
# Quindi mettiamo tutte le parola in maiuscolo
set_ricerca = set(map(lambda x: x.upper(), set_ricerca))
set_chiavi = set(map(lambda x: x.upper(), set_chiavi))
# Calcola l'intersezione
match = set_ricerca & set_chiavi
print(match)
#OUTPUT -> {"GIORGIO", "CIAO"}
Questo metodo sopra non riesce a cercare parole che contengano più spazi, come "università degli studi di torino", ma è qualcosa che si può sistemare con qualche linea di codice ma pensa prima a far funzionare la versione più basilare.
Spero di averti dato almeno un punto su cui partire.