Branchez-vous sur les fils d�informations
Pour des sites qui publient r�guli�rement des mises � jour, la meilleure option est de profiter des fils d�informations qui ont d�j� �t� pr�par�s au format RSS (Rich Site Summary) dans l�optique d�une reproduction ult�rieure sur d�autres sites. Bas�s sur le XML, les fils d�informations en RSS vous donne le titre, l�URL et parfois une courte description de l�article. Ils peuvent �tre un excellent moyen de r�cup�rer l�essentiel de l�information, et faciliter grandement la t�che de veille sur un nombre important de sites.
De nombreux sites Web publiant des actualit�s de leur domaine d�activit� fournissent �galement un fil d�information. En outre, des agr�gateurs sp�cialis�s comme http://w.moreover.com/categories/category_list_xml.html construisent leurs propres cha�nes sur un domaine sp�cifique, qui rassemblent les meilleurs fils d�informations d�autres sites. Aussi bien les fils d�un seul site que les cha�nes du type Moreover peuvent �tre int�gr�s dans l�interface unique de Watznew, et �tre mis � jour � des intervalles r�guli�rs.
Pour localiser des fils d�infos int�ressants, nous avons utilis� les sites Web http://www.newsisfree.com/ et http://www.syndic8.com/, qui maintiennent des annuaires de plusieurs milliers de fils d�informations, traitant d�� peu pr�s tous les sujets pr�sents sur le Web. Il suffit d�identifier le fil qui vous int�resse, de rentrer ses coordonn�es dans Watznew, et l�information tombera r�guli�rement sur votre bureau. Bien que Watznew vous permette de configurer la fr�quence de v�rifications des sources � chaque minute, si vous le souhaitez � dans la pratique, NewsIsFree limite les mises � jour � une heure par fil, pour �viter la saturation de leur serveur. N�anmoins, les fils d�info constituent sans doute une des meilleures utilisations de Watznew.
La surveillance de pages HTML sur le Web est �galement possible dans les cha�nes HTTP de Watznew, � partir des balises HTML que vous aurez pr�cis�es. Cela peut �tre une option utile quand aucun fil d�info n�est disponible. Mais, comme le fait remarquer l��diteur de Watznew, cet outil n�est pas vraiment adapt� � la surveillance de pages Web enti�res, ce qui serait trop consommateur de ressources. La surveillance d�un site complet n�est pas envisageable avec Watznew.
Le deuxi�me type de cha�ne concerne les comptes e-mail POP3. Ceux-ci sont tr�s simples � mettre en place : l�objet, l�exp�diteur et la date de cr�ation des messages sont affich�s dans Watznew, et le client de courrier �lectronique peut �tre lanc� avec un clic pour visualiser le message complet.
Enfin, la troisi�me possibilit� est de configurer vos propres cha�nes en utilisant un script Perl. Plusieurs scripts de base sont disponibles, tels IPCONFIG.pl et Environment Variables.pl, qui affichent respectivement les donn�es r�seau de votre machine et les variables d�environnement. En ce qui concerne la surveillance automatique, seules deux modules sont utilisables : HTTP GET. Pl, qui donne la possibilit� de t�l�charger une page et d�en extraire diff�rents �l�ments, et �ventuellement Ping, pour v�rifier la disponibilit� d�un serveur.
Ces modules sont convenablement interfac�s avec Watznew. La configuration d'une nouvelle cha�ne bas�e sur un site de presse du type Yahoo ! News s'av�re ais�e pour une personne ma�trisant les expressions r�guli�res. Il s'agit d'un ensemble de code permettant d'identifier et d'extraire des �l�ments d'un document : titre et URL d'une page dans notre cas. Ces �l�ments seront ensuite affich�s dans l'interface de Watznew. Certaines sources disposent de protections anti-agent sp�cifiques (d�tection de l'user agent, cookies de session, redirections multiples). Watznew g�re certaines de ces protections, mais il faudra dans ce cas ajouter une ou deux lignes de Perl dans les scripts de capture. L'interface offre la possibilit� de visualiser les en-t�tes HTTP et les cookies transmis pour d�buggage.
L'utilisation de Perl et de ses puissantes expressions r�guli�res est une bonne initiative. L'interfa�age de cette fonctionnalit� avec l'outil demeure r�serv� � des utilisateurs avertis mais est r�ussi. Watznew est m�me un bon outil pour s'initier et s'exercer aux expressions r�guli�res.
|