Desenvolupen un sistema intel·ligent que detecta «notícies falses»

per EP / NLV

Societat

Desenvolupen un sistema intel·ligent que detecta notícies falses
Desenvolupen un sistema intel·ligent que detecta notícies falses

Un equip d'investigació de les universitats de Jaén i Alacant ha creat una aplicació que analitza les notícies de manera automàtica i determina la veracitat d'aquestes amb una alta precisió. Encara que el model està encara en fase de testatge, es proposa com una eina útil per a filtrar la quantitat d'informació que arriba cada dia a periodistes i lectors.

Basat en tècniques d'intel·ligència artificial, el sistema testa la notícia en dos nivells detectant si existeixen incongruències en el contingut i si l'estructura coincideix amb la que qualsevol publicació amb rigor periodístic ha de tindre.

Amb l'objectiu d'oferir una major confiança al lector i dotar els periodistes de noves eines que li permeten discernir entre diverses informacions, els investigadors han publicat en la revista Expert Systems with Applications un article titulat 'Exploiting discourse structure of traditional digital mitjana to enhance automatic fake news detection' en el qual presenten el prototip d'un detector de 'fake news' per a webs.

El sistema, segons s'ha informat des de la Fundació Descobreix, analitza l'estructura de la notícia publicada atenent les normes de periodisme clàssiques: la regla de les 5W+H, coneguda així per les sigles de les qüestions en anglés, i la piràmide invertida.

Aquestes guies se sustenten en què la notícia rigorosa ha de contindre informació que responga a les sis preguntes bàsiques (què?, quan?, on?, qui?, per què? i com?) i que es presente en gradació des del més important fins als detalls.

«L'estructura d'una publicació ens dona pistes de si hi ha base periodística o si, per contra, imita a una notícia real», ha indicat l'investigador de la Universitat de Jaén (UJA) Miguel Ángel García, autor de l'article.

A partir de l'anàlisi del llenguatge natural, els experts desenvolupen un algorisme que detecta les informacions que no responen a aquesta estructura. Aquests càlculs es basen en tècniques d'aprenentatge automàtic, també conegut com 'machine learning', de manera que el sistema va aprenent a mesura que va acumulant dades.

A més, la màquina pot processar en segons milers de dades simultànies, alguna cosa que una persona no podria fer. La investigadora de la Universitat d'Alacant Estela Saquete, també autora de l'article, ha apuntat que amb aquest sistema, els periodistes poden contrastar fonts, detectar estructures incorrectes, viralitzades, o que tinguen incongruències entre el titular i el cos de manera immediata i automàtica. També l'usuari final pot tindre evidències de si la notícia que llig compleix amb uns estàndards o no.

Els equips 'Sistemes Intel·ligents d'Accés a la informació' (Sinai), de la Universitat de Jaén, i 'Grup de Processament del Llenguatge Natural i Sistemes d'Informació' (Gplsi), de la Universitat de, Alacant, van realitzar les proves sobre un conjunt de dades en espanyol amb més de 200 articles centrats en temes sanitaris, d'especial rellevància en l'actualitat a causa de les nombroses notícies falses que circulen sobre covid-19.

El sistema pren com a base l'aprenentatge profund, amb el qual es creen models computacionals compostos per diverses capes de processament de dades. Concretament en aquest treball, els experts defineixen dues capes. D'una banda l'estructura de la notícia i per un altre l'argument. D'aquesta manera, la màquina prediu no sols la credibilitat de la forma, sinó també del contingut.

A més, els investigadors han aplicat un nou esquema en el tractament de les dades, conegut com a anotació de gra fi, que consisteix a establir etiquetes a les notícies. Aquestes marques s'apliquen a totes les possibilitats, encara que les diferències siguen xicotetes. D'aquesta manera s'obté una descripció detallada en els dos nivells per a cada text.

Cada etiqueta té un conjunt d'atributs que proporcionen informació més enllà del lingüístic incloent la verificació de fets, relacions semàntiques entre components o característiques contextuals. Fins i tot, referencia aspectes relacionats amb la càrrega emocional que puga contindre un escrit i que l'allunyen de l'objectivitat que ha de tindre una notícia real.

L'objectiu dels experts és aconseguir una aplicació que marque automàticament el text d'una notícia mentre es llig i que alerte mitjançant un senyal de parts de la notícia que puguen ser falses, indicant la referència amb altres textos similars en els quals es puga contrastar la seua veracitat.

Aquesta investigació s'ha desenvolupat mitjançant els projectes 'Living-LANG: Modelatge del comportament d'entitats digitals mitjançant Tecnologies del Llenguatge Humà', del Ministeri de Ciència i Innovació i 'SIIA: Tecnologies del llenguatge humà per a una societat inclusiva, igualitària, i accessible' de la Comunitat Valenciana.

Agermana't

Cada dia estem més prop d'aconseguir l'objectiu de recuperar Diari La Veu. Amb una aportació de 150€ podràs obtindre una devolució de fins al 100% de l'import. Et necessitem ara. Informa't ací.