Storia

cos'è?
Ogni giorno raccogliamo tramite RSS gli articoli online messi a disposizione da varie testate nazionali. Presentiamo poi qui 5 articoli rilevanti relativi a storie che si sviluppano nel tempo come ad esempio l'ascesa di un leader politico, il campionato di calcio, una guerra. Questa schermata vi presenta 5 storie tra quelle riferite dagli articoli odierni. Leggendo la storia ne saprai di più.
chi sceglie le storie?
Ogni "storia" è identificata automaticamente cercando negli articoli passati contenuti fortemente correlati con l'articolo del giorno. Non c'è nessun intervento umano nell'individuazione della storia: gli articoli mostrati sono semplicemente scelti fra quelli odierni che, secondo l'algoritmo di correlazione, possono essere collegati a molti articoli osservati nel passato.
cosa rappresentano le parole a sinistra del titolo dell'articolo?
Il tagcloud sulla sinistra rappresenta la classificazione prevalente degli argomenti a cui appartiene la storia. La classificazione è assolutamente automatica, ed è ottenuta grazie ad un modello di classificazione costruito mediante apprendimento automatico su alcune classi originariamente fornite dalle testate stesse.
cos'è?
In questo grafico sono rappresentati, lungo l'arco temporale, articoli precedenti pertinenti alla medesima storia, come determinato dall'algoritmo di correlazione. Le "bolle" sul grafico sono tanto più in alto quanto più gli articoli di quel giorno sono correlati all'articolo originale (quello di oggi).
perché alcune "bolle" sono più grandi?
La dimensione delle bolle indica il numero di articoli correlati a quello di partenza in quello specifico giorno. In alcuni giorni o periodi possono esserci eventi molto rilevanti e significativi per la storia di interesse: quei periodi saranno caratterizzati da "agglomerati" di bolle più grandi.
le bolle sono troppo ammassate!
Quando gli eventi sono molto prossimi tra loro, le "bolle" formano agglomerati che indicano la particolare rilevanza di quella data per la storia. È possibile "zoomare" la timeline selezionando con il mouse l'area di interesse.
come seguo il dipanarsi della storia?
Passando con il mouse sopra una bolla, i titoli degli articoli all'interno di essa appaiono in un "tooltip". Clickando sulla bolla, il dettaglio della giornata appare nel riquadro in basso a destra.
chi sceglie gli articoli mostrati?
Tutto il processo è interamente automatico. Quando il sistema recupera un nuovo articolo via RSS, tra le fonti monitorate, l'algoritmo di correlazione cerca fra gli articoli passati quelli più direttamente correlati all'articolo odierno, ricostruendo così automaticamente la storia. Per maggiori dettagli sull'algoritmo di correlazione, visita la sezione tecnologie.
cos'è?
Questo diagramma a torta rappresenta la classificazione per argomento (topica) degli articoli del giorno selezionato. Di una stessa storia possono far parte articoli che offrono varie prospettive, p. es. un taglio economico piuttosto che politico relativamente ad una legge varata dal governo.
chi determina la classificazione?
Il processo di classificazione è interamente automatico. Il sistema si basa su un algoritmo di apprendimento automatico applicato ad esempi preclassificati secondo varie categorie determinate da classificazioni precedenti ottenute dagli RSS stessi. Il risultato è un modello di classificazione che può essere applicato a nuovi articoli per determinarne l'appartenenza ad una categoria piuttosto che ad un'altra.
cosa significa la presenza di più categorie?
Così come una persona potrebbe collocare un articolo a metà tra due classi, l'algoritmo è in grado di restituire la "certezza" con la quale determina la classificazione. Secondo l'algoritmo, un articolo potrebbe ad esempio parlare prevalentemente di sport, ma avere anche un taglio relativo agli spettacoli (p. es., un articolo che parli di una trasmissione sportiva).
cos'è?
In questo riquadro vengono riportate le sintesi degli articoli del giorno selezionato giudicati dall'algoritmo di correlazione pertinenti alla storia.
l'algoritmo è basato su liste di concetti o altra conoscenza a priori?
No, tutti i calcoli sono effettuati sulla base di modelli di semantica latente che sfruttano l'intera collezione di articoli per identificare le caratteristiche più discriminanti dei testi. L'intero processo di analisi sfrutta quindi l'intelligenza collettiva emergente dall'insieme di articoli collezionati nel tempo. È uno dei grandi punti di forza dell'apprendimento automatico.
chi ha prodotto la sintesi?
La sintesi è prodotta in maniera interamente automatica, identificando con un sofisticato algoritmo di sommarizzazione le parti più salienti ed informative dell'articolo. La produzione della sintesi è basata sul testo dell'articolo recuperato direttamente da web, e non è soggetta ad alcuna correzione/editazione manuale.
questo articolo/sintesi non mi sembra pertinente!
Per processare gli articoli questi vengono estratti automaticamente dalle URL recuperate tramite RSS. Questo processo è necessariamente euristico, e può capitare che vengano estratti, assieme all'articolo principale, anche gli eventuali commenti ad esso che si trovino nella pagina web riferita. In questo caso, ovviamente, il calcolo della correlazione può essere "depistato" dal testo dei commenti.
posso leggere l'articolo originale interamente?
In fondo alla sommarizzazione di ogni articolo è riportata sia la fonte originale che il link alla pagina dalla quale l'articolo è stato automaticamente recuperato. LUCENSE non è responsabile del testo presentato di cui non è autrice: la proprietà del testo è interamente delle relative testate.
what's this?
We collect daily news articles from serveral newspapers RSS feeds. We show here 5 relevant articles telling stories that have been developing over time, such as a political leader’s carreer, the national championship development, a war. This page shows 5 articles published today. By reading the associated story, as automatically reconstructed by the system, you will learn more about the event.
who chooses the stories?
Every “story” is computed automatically by looking in the collection of past articles for strongly correlated items to the article of the day. There is no human intervention at any point in the process: the articles shown in this page are randomly chosen among those that, as determined by the correlation algorithm, feature many articles in their story.
what are the words next to the article title?
The tagcloud to the left represents the categorization of the topics discussed in the story. Categorization is performed automatically, thanks to a categorization model build by means of machine learning on categories defined by Wikinews.
what's this?
This chart represents along a temporal axis past articles pertaining to the story, as determined by the correlation algorithm. The “bubbles” in the chart are positioned higher according to the correlation score with today's article (which can be seen represented to the extreme right of the chart).
why are some bubbles larger?
The size of the bubbles represents the number of correlated articles in the specific day. In the development of a story, some dates are more important than others, due to the significance of the events occurring that day: the ensuing “media burst” means that more articles pertaining to the story are available in that period.
bubbles are too amassed!
When events are very close to each other, bubbles “cluster” together, signifying the activity of the story in that period. You can zoom in on the period by selecting the area with the mouse, therefore making it possible to show the bubbles with more spacing.
how do I follow the development of the story?
By hovering with the mouse pointer over a bubble, the titles of the articles contained therein are displayed in a tooltip. By clicking the bubble, the details of the day appear in the lower right frame.
who chooses which articles to show?
The process is entirely automatic. When the system fetches a new article via the RSS feed of the monitored source, the correlation algorithm searches among the old articles those more directly correlated to it. This results in the reconstruction of the history of events. For more information on the correlation algorithm, visit the technology page of this site.
what's this?
This pie chart represents the topic categorization for the articles of the selected day. Articles belonging to the same story might give a different perspective over it, for example an economic vs political perspective over a law promulgated by the government.
who determines the categorization?
The categorization is entirely automatic. The system is based on a machine learning algorithm applied to pre-categorized examples as fetched from WikiNews. The result is a categorization model that is used to determine which categories every new article belongs to.
why are there several categories, occasionally?
Just as a person might be undecided between two or more categories when classifying a document that doesn not seem to fit one of them exclusively, so does the algorithm, by returning its “certainty” in assigning specific categories. An article might indeed lie across several categories depending on the perspective it offers (e.g. an article about a sports host tv program might belong to both the “sports” and “entertainment” categories).
what's this?
This area is populated with excerpts from the articles of the story of the selected day.
is the algorithm based on concepts lists or other a-priori knowledge?
No, all computations are performed basing on latent semantic models that leverage the entirety of the articles collection fetched to this day in order to identify the most discriminating features. The whole analysis process therefore exploits collective intelligence emerging from the set of articles collected over time. This is one of the great advantages of machine learning-based approaches.
who wrote the summary?
The article excerpts are generated automatically by selecting, thanks to a sophisticated summarization algorithm, the most relevant sentences in the text. The basis for the summary is the article text as fetched from the original webpage, and is not subject to any manual correction or editing whatsoever.
the summary of this article doesn’t seem pertinent to the story!
In order to process the articles automatically, they are fetched from the original URLs referred in the RSS feed. This process is heuristic by necessity, because the URLs actually features ads, comments, other text which might occasionally creep into the retrieved text. This might sometimes upset the successive computation and summarization processing.
can I read the whole original article?
We always report the original source, along with the link, at the bottom of the summary. The link is the original one used by the fetching process. LUCENSE is not the author of, owner of, ot responsible for the text shown: the original ownership is entirely of the relative source.