Content Filtering

Da Wiki.

Indice

[modifica] Come difendersi dall'utilizzo personale dell'internet aziendale

L'abuso dell'utilizzo di internet sul posto di lavoro sta diventando un problema critico per molte aziende. Infatti, oltre a essere un valido canale informativo, il Web offre facili motivi di distrazione, con conseguenze negative sulla produttività.

Si pensi per esempio al fenomeno dei social-network e in particolar modo a Facebook che ha assorbito gran parte del traffico di rete in quanto punto di ritrovo e di svago di milioni di persone anche in orario lavorativo.

L'uso degli strumenti internet a fini non professionali costituisce inoltre una quotidiana fonte di rischio: la presenza di tracce informatiche lasciate dai dipendenti su siti a luci rosse, siti di gioco d'azzardo o di condivisione di file (download di film e musica) potrebbero causare un serio imbarazzo all'azienda, con conseguente danno all'immagine o problemi legali. Da oggi con WebControl è possibile arginare questo fenomeno bloccando il traffico dati verso siti non attinenti all'attività lavorativa, tramite un sistema di content-filtering che impedisce l'uso improprio di Internet attraverso l'analisi dei contenuti o delle direttive configurate in sede aziendale. E' sufficiente questo piccolo dispositivo hardware per filtrare l'intera rete locale, sia essa costituita da pochi pc fino a diverse centinaia. Non è richiesta l'installazione di alcun software, è sufficiente collegare WebControl in cascata al proprio router. Il dispositivo è rispettoso della normativa sulla privacy vigente e dello statuto dei lavoratori.

[modifica] Funzionalità

Le funzionalità proposte dal sistema sono molteplici e varie, è possibile configurare la macchina con diversi profili a seconda delle specifiche esigenze.

  • Configurazione:

Il sistema può lavorare in due modi, per contenuti o per indirizzi. Nel primo caso occorre indicare un vocabolario secondo il quale il sistema blocca i siti a maggior contenuto di parole inserite nel vocabolario, nel secondo il sistema di bloccaggio si basa su un elenco di indirizzi precedentemente specificati. La configurazione può essere prevista anche utilizzando un' integrazione tra entrambi i metodi.

  • Scelta di funzionamento:

E' possibile scegliere come far lavorare la macchina nell' accesso agli indirizzi internet secondo due metodi: per White List o per Black List. Il primo metodo permette di inserire un elenco di siti a cui è possibile accedere, nel secondo si inserisce una lista di indirizzi bloccati verso i quali si blocca l'accesso.

  • Postazioni privilegiate:

E' possibile configurare all'interno della rete delle postazioni privilegiate a navigazione libera senza incorrere nelle limitazioni previste dal sistema.

  • Modalità di avviso bloccaggio

Il sistema può lavorare anche senza bloccaggio dell'accesso ai siti, ma segnalando all'utente navigatore che si sta per accedere ad un sito vietato con l'intento di inibire la navigazione; l'utente dopo l'avviso può comunque scegliere di entrare.

Pagina del browser in caso di richiesta di un sito bloccato


  • Modalità siti bloccati

Il sistema blocca l'accesso ai siti mediante una segnalazione come in figura.

Pagina del browser in caso di richiesta di un sito bloccato


  • Visualizzazione Log:

Il sistema integra un modulo per la visualizzazione dei log che fornisce anche statistiche sull'utilizzo del sistema di content filtering che permette di avere una visione globale sul funzionamento del prodotto. L'interfaccia dello strumento di analisi dei log sarà predisposta in futuro anche in lingua italiana.

Vedi paragrafo consultazione log

[modifica] WebControl - Caratteristiche

WebControl.jpg
  • Possibilità di installazione su qualsiasi rete in modo trasparente
  • Non è richiesta l'installazione di alcun software sui pc della rete
  • Filtri automatici in base ai contenuti rilevati nelle pagine
  • Regole di filtraggio personalizzabili
  • Già inclusa una black-list di siti non decorosi


[modifica] Dimensioni e peso
  • Larghezza 19 cm
  • Profondità 28 cm
  • Altezza 17 cm
  • Peso 3 kg


[modifica] Posizionamento del dispositivo

Config dispositivo.jpg


Config dispositivo2.jpg


[modifica] Consultazione dei log

Riepilogo percentuale dei siti bloccati su siti visitati
Analisi dettagliata degli accessi web
Riepilogo dei siti più bloccati
Riepilogo dei siti più visitati


Tempo di permanenza sul sito per ogni utente
A volte si vorrebbe conoscere il tempo che un utente ha speso nella navigazione Internet durante l'orario di lavoro.

Tale analisi risulta tecnicamente complessa. Per capire le problematiche sottostanti, ecco alcuni esempi:

1° esempio

L'utente apre una pagina web di un quotidiano, legge i titoli degli ultimi articoli pubblicati, impiegando 1 minuto. Quindi abbassa la finestra del browser e continua a lavorare. Dopo 30 minuti decide di leggere un articolo dalla pagina lascia aperta in precedenza impiegando 5 minuti.ca. Il tempo effettivo speso sul web è di 36 minuti o di soli 6 minuti ??? Ad oggi non è rilevabile il tempo dedicato alla lettura di una pagina web se non installando dei software sul pc dell'utente stesso che sono in grado di determinare la finestra in primo piano sul Desktop dell'utente e di registrarne i tempi.

2° esempio

L'utente apre il sito di un quotidiano online, legge i titoli in 1 minuto e abbassa la finestra, la pagina si aggiornerà in automatico ogni 6 minuti circa anche se l'utente continuerà a lavorare sul un altro software come ad esempio un programma di contabilità.

Dopo circa un'ora, la pagina del quotidiano è stata aggiornata dieci volte, dall'analisi dei log di acceso a internet potrebbe sembrare che l'utente abbia passato l'ultima ora a navgare in rete, ma in realtà ha speso solo 1 minuto del suo tempo. In realtà è la pagina che si aggiornava in automatico a generare le richieste di accesso web.

3° Esempio

L'utente apre un capitolo di un e-book (un libro online). Supponiamo che il tempo di caricamento della pagina sia pari a 20 secondi. L'utente poi impiega 45 minuti nella lettura e infine chiude il browser. In questo caso i log di accesso internet registreranno solo i 20 secondi di caricamento della pagina.
Conclusioni:

Nonostante tutte queste problematiche, lo strumento software di analisi dei log progettato e sviluppato da iubar, attraverso un algoritmo euristico, cerca di determinare i tempi di permanenza su un sito. Ad esempio se l'utente apre la pagina A, si sposta poi sulla pagina B e infine sulla pagina C, è possbile calcolare i tempi di navigazione. In più, l'algoritmo euristico è in grado di determinare i tempi di lettura quando questi sono inferiori a una determinata soglia. I risultati non sono sempre puntuali, viste le problematiche sopra descritte, ma offrono una visione qualitativa dell'utilizzo delle risorse internet in azienda.

L'algoritmo euristico non permette di risolvere la problematica descritta nell'esempio 3, cerca comunque di determinare una soluzione al problema dell'esempio 1 e 2 Per ottenere risultati esatti in ogni situazione non è sufficiente l'analisi dei log di accesso alla rete.
La soluzione potrebbe essere quella di monitorare il Desktop dell'utente con software dedicati come ad esempio ManicTime:

Manictime.jpg


[modifica] Privacy

Per il trattamento dei file di log é indispensabile considerare le linee guida del Garante per posta elettronica e internet che possiamo così riassumere:

  • I datori di lavoro pubblici e privati non possono controllare la posta elettronica e la navigazione in Internet dei dipendenti, se non in casi eccezionali. Spetta al datore di lavoro definire le modalità d'uso di tali strumenti ma tenendo conto dei diritti dei lavoratori e della disciplina in tema di relazioni sindacali.
  • Il Garante privacy, con un provvedimento generale che sarà pubblicato sulla “Gazzetta Ufficiale”, fornisce concrete indicazioni in ordine all'uso dei computer sul luogo di lavoro. “La questione è particolarmente delicata – afferma il relatore Mauro Paissan – perché dall'analisi dei siti web visitati si possono trarre informazioni anche sensibili sui dipendenti e i messaggi di posta elettronica possono avere contenuti a carattere privato. Occorre prevenire usi arbitrari degli strumenti informatici aziendali e la lesione della riservatezza dei lavoratori”.
  • L'Autorità prescrive innanzitutto ai datori di lavoro di informare con chiarezza e in modo dettagliato i lavoratori sulle modalità di utilizzo di Internet e della posta elettronica e sulla possibilità che vengano effettuati controlli. Il Garante vieta poi la lettura e la registrazione sistematica delle e-mail così come il monitoraggio sistematico delle pagine web visualizzate dal lavoratore, perché ciò realizzerebbe un controllo a distanza dell'attività lavorativa vietato dallo Statuto dei lavoratori. Viene inoltre indicata tutta una serie di misure tecnologiche e organizzative per prevenire la possibilità, prevista solo in casi limitatissimi, dell'analisi del contenuto della navigazione in Internet e dell'apertura di alcuni messaggi di posta elettronica contenenti dati necessari all'azienda.
  • Il provvedimento raccomanda l'adozione da parte delle aziende di un disciplinare interno, definito coinvolgendo anche le rappresentanze sindacali, nel quale siano chiaramente indicate le regole per l'uso di Internet e della posta elettronica.
  • Il datore di lavoro è inoltre chiamato ad adottare ogni misura in grado di prevenire il rischio di utilizzi impropri, così da ridurre controlli successivi sui lavoratori. Per quanto riguarda Internet è opportuno ad esempio:
    • individuare preventivamente i siti considerati correlati o meno con la prestazione lavorativa;
    • utilizzare filtri che prevengano determinate operazioni, quali l'accesso a siti inseriti in una sorta di black list o il download di file musicali o multimediali.

[modifica] Alcune immagini del dispositivo

Foto1.jpg
Foto2small.jpg
Schema di funzionamento dei software DansGuardian e Squid utilizzati da WebControl