Tecnologie
Le attività di ricerca nel campo delle ICT condotte da LUCENSE abbracciano un ampio spettro di ambiti.
Text Analytics
Nel contesto della Text Analytics, LUCENSE dispone di una gamma di tecnologie che vanno dall’analisi di strutture base del linguaggio (come la sintassi elementare e l’analisi morfologica) ad analisi approfondite legate ai contenuti dei documenti osservati.
Analisi di base
Per gestire automaticamente testo occorre riconoscerne alcune strutture elementari come le parole, i periodi, le categorie sintattiche delle parole, le loro variazioni morfologiche, la struttura della frase, eccetera. LUCENSE dispone di una pipeline completa per l’analisi del testo che è usata solitamente come elemento abilitante per le analisi di maggior dettaglio.
Classificazione dei contenuti
La prima potente tipologia di analisi dei contenuti è la classificazione, per argomento o per altre caratteristiche, di un documento rispetto ad un insieme di categorie predefinite. Questa operazione facilita l’organizzazione ed il recupero di documenti, consente l’individuazione di contenuti rilevanti e permette in molti casi di automatizzare parti di flussi documentali. Basato interamente su un processo di apprendimento automatico, il sistema sviluppato da LUCENSE è pensato per abbattere i tempi ed i costi di personalizzazione, facilitandone l’applicazione a contesti diversi senza che siano richiesti gravosi interventi di customizzazione.
Identificazione di temi emergenti
In un contesto di flusso continuo e quotidiano di informazioni sui vari canali di comunicazione digitale è di grande utilità, oggi, la possibilità di individuare automaticamente gli argomenti maggiormente discussi, in modo da avere a disposizione in ogni momento una “istantanea” dei temi più “hot”. LUCENSE sfrutta moderne teniche di topic discovery, clustering e sommarizzazione automatica per identificare automaticamente argomenti discussi (assegnando loro etichette parlanti) e messaggi correlati a tali argomenti, e fornire una sintesi dei contenuti trattati.
Correlazione
Dato un documento, quali altri gli sono affini per contenuto? A questa semplice domanda è difficile dare risposta con i meccanismi di ricerca standard basati su keyword di ricerca. Al contrario, i sistemi sviluppati in LUCENSE, basati su semantica latente, consentono l’individuazione rapida di contenuti affini ad uno di interesse, dei quali non si conosceva necessariamente l’esistenza. La ricerca per correlazione è un modo molto efficace di garantire l’accesso ai contenuti disponibili di interesse per l’utente.
Raccomandazione
Quando molti utenti accedono ad un sistema, molte informazioni sul loro comportamento possono essere collezionate adottando tecniche di collective intelligence: il risultato è un modello di comportamento dell’utente derivato dalla comunità. Questo modello consente di individuare, rispetto ad un’offerta, gli elementi che possono essere di interesse per un utente sulla base della sua similitudine con altri utenti. Il modello è inoltre applicabile anche in forma duale, per cui è anche in grado di suggerire, dato un prodotto, potenziali acquirenti interessati nella comunità di utenti conosciuti. Oltre all’ovvia applicazione nell’ambito di pubblicità mirata, il sistema può anche fungere da sistema proattivo di suggerimento di nuovi contenuti, con un grande beneficio informativo per l’utente.
Analisi dei grafi
Moltitudini di oggetti in relazione tra di loro costituiscono una struttura detta grafo, che è adatta a rappresentare realtà molto diverse tra loro, da reti di calcolatori a reti stradali, da relazioni tra concetti o parole a reti sociali. L’astrazione permette di ragionare sulla rete in termini di proprietà matematiche di essa, e di individuare nodi, sottoinsiemi o archi con caratteristiche particolari, che poi possono essere interpretati in vario modo e con varia utilità nello specifico dominio applicativo. Ad esempio, si può determinare la forza del collegamento tra due nodi, il percorso più breve tra essi, la centralità di un nodo rispetto al grafo, l’importanza di un nodo nell’interconnessione tra due sottografi, e simili. Questo si può tradurre, nella realtà applicativa, ad esempio nell’individuazione di soggetti prominenti in un social network, dell’importanza di un nodo stradale sulla viabilità, dell’elemento più critico di una rete di comunicazione.
Analisi del sentiment
L’analisi del sentiment è la capacità di cogliere il "mood" espresso in un testo: positivo, negativo, neutro. Annotare testi con questo elemento consente di fornire un’ulteriore prospettiva su insiemi di discussioni analizzate: ad esempio, mettendo assieme questa funzionalità con l’individuazione dei temi emergenti, si possono tenere d’occhio non solo gli argomenti più discussi, ma anche l’orientamento generale della popolazione nei confronti di essi. Questo ha applicazioni molto interessanti, come ad esempio il monitoraggio online di certi argomenti, che possono andare dalla valutazione di un marchio o un prodotto, su una città o un ristorante, fino ai pareri nei confronti di un determinato personaggio.
Multilinguismo
Tutte le tecnologie sviluppate da LUCENSE pongono particolare attenzione all’aspetto multilingua: adottando dovunque possibile tecniche di apprendimento automatico, si è sempre cercato di non vincolare l’applicabilità degli strumenti a specifiche lingue. Un interessante campo di applicazione della text analytics è infatti quello di avere il “polso” di discussioni su argomenti di interesse in paesi o lingue che si conoscono poco. Cosa si pensa in Cina del mio brand? Cosa dicono in India dei nostri marò? Sono esempi di campi di applicazione di sistemi multilingua ad alto ed immediato valore aggiunto per l’utente.