OlivierPommeret.com

lundi 28 janvier 2008

Obtenir les dernières nouvelles sur Internet le plus rapidement possible

L'équipe du professeur en informatique Carlos Guestrin, de l'Université de Carnegie Mellon à Pittsburgh, a appliqué son algorithme appelé "Cascades" aux blogs. Cet algorithme, initialement développé pour identifier le plus rapidement possible les sources de contamination dans un réseau de distribution de l'eau, permet, appliqué aux blogs, de classer ces derniers suivant différents critères (nombre et régularité des publications, liens pointants vers d'autres blogs, etc.) afin d'identifier ceux sur lesquels l'information apparait en premier lieu sur Internet.... avant d'être reprise par contamination sur les autres blogs.
Différents classements ont pu être établis (voir liens ci-dessous) dont notamment un "top 100" des blogs (sur une base de données de 45 000 blogs) à lire en priorité si on veut obtenir les actualités les plus "fraiches" d'Internet.
Une liste qui a donc tout intérêt à figurer dans votre agrégateur de flux RSS, d'autant plus si vous utilisez cet outil pour faire de la veille sur des sujets d'actualité.

Attention cependant, le classement se base sur les publications de 2006. Ainsi, dans les premiers blogs du top 100 on trouve par exemple un site qui a cessé d'être alimenté depuis fin 2007. Sauf accident de parcours, la liste devrait rester cependant pertinente pour 2008.

Liens

Tags:   ::   ::   ::   ::  

vendredi 11 janvier 2008

Un pour tous et tous pour tous : Knol versus Wikipedia

Vous avez surement entendu parler de "Knol", l'encyclopédie "collaborative" en ligne que Google veut/va lancer prochainement. On nous annonce que cette encyclopédie viendra directement concurrencer Wikipedia ... oui et non.

Oui parce que les moteurs de recherche pointeront aussi bien vers Knol que vers Wikipedia (encore qu'on ne sait pas pour le moment si Google privilégiera ou pas l'affichage de liens dans ses résultats vers Knol par rapport à Wikipedia ... on sait cependant que les pages de Knol seront très bien classées dans Google) et qu'il ne fait pas de doute que certains contributeurs de Wikipedia migreront vers cette nouvelle solution, et ceci pour plusieurs raisons: les articles, même s'ils pourront être commentés par les Internautes, seront signés, ce qui plaira à ceux qui voudront se faire un nom dans un domaine donné (encore faudra-t-il avoir un moyen de savoir avec certitude que la personne qui poste sous un certain nom est réellement cette personne) mais surtout les auteurs seront rémunérés via les publicités en fonction du nombre de consultations des pages.

Non, car je reste convaincu que la pertinence des articles ne peut être donnée que par la participation collaborative de différents auteurs. De plus, on trouvera désormais avec Knol dans les résultats de recherche plusieurs pages sur les mêmes sujets, ce qui va multiplier les sources d'informations plus ou moins contradictoires et donc la confusion. Si d'un côté on pourra apporter beaucoup de crédit aux propos tenus par un spécialiste sur un sujet donné par rapport à une personne moins reconnue, cela implique également d'un autre côté une certaine orientation et prise de position sur les articles. Quand on voit comment les chercheurs, des gens pourtant très compétents et fiables dans leurs domaines, peuvent se battre entre eux sur un sujet précis pour essayer d'imposer leurs avis contradictoires, je me demande bien ce que cela va donner sur Knol et quel article on devra choisir comme pertinent sur un sujet donné. Google parle d'une "mise en concurrence" des contributeurs sur un même sujet ... je me demande bien suivant quel processus (vote des internautes ? avis d'un expert ? etc.) et quelle sera sa pertinence ?

Google réinvente en quelque sorte le ... blog personnel ! Le calendrier en moins ...

Comme évoqué plus haut, je me pose des questions concernant la certitude qu'on aura sur l'origine des participations ainsi que sur la protection de son nom. Par exemple, vous pouvez toujours si vous le voulez tenter de créer un site Internet avec le nom de quelqu'un pour lui faire dire des propos qu'il n'approuve pas. Il y aura la plupart du temps un moyen pour la personne concernée de contacter l'hébergeur pour se plaindre et faire fermer le site. Mais avez-vous essayé un jour de contacter Google ? J'ai déjà eu à le faire et entre les messages automatiques par téléphone demandant d'écrire à une adresse e-mail dont on vous répond que cette adresse ne peut pas être utilisée pour contacter Google (!) et les messages en ligne auxquels vous n'avez jamais de réponse, je peux vous dire que ce n'est pas vraiment évident. Ainsi, que va-t-il se passer si pour une raison ou une autre (je ne parle même pas de destabilisation), vous vous faites passer pour un spécialiste reconnu dans un domaine donné pour déformer ses propos et lui faire dire des choses qui discréditeraient ce spécialiste ? Je suppose que Google a dû réfléchir à ça et trouver une parade...

Ironie de l'actualité, en parallèle, Jim Wales, co-fondateur de Wikipedia et créateur de Wikia, a lancé en version alpha le 7 janvier dernier un moteur de recherche collaboratif utilisant les ressources libres des processeurs des Internautes pour indexer le web. Certes les résultats de ce nouveau moteur sont pour le moment très approximatifs, mais nous avons peut-être là le futur Google ?! En tout cas, même si cela n'est pas volontaire, cela ressemble fortement à une réponse de la part de la communauté Open Source contre cette nouvelle initiative de Google ...

Sources et liens

Tags:   ::   ::   ::   ::   ::   ::   ::   ::   ::   ::   ::  

mercredi 9 janvier 2008

Technorati ... efficace mais quand ça marche !

Un billet pour avoir votre avis concernant un problème avec Technorati.
Je sais qu'une bonne partie des lecteurs de ce blog gèrent eux même un blog. La grande majorité utilise les tags Technorati. Ces derniers sont très pratiques pour naviguer de manière thématique entre les billets de blogs ... seulement faut-il encore que cela marche !

J'utilise Technorati depuis la création de ce blog. Mes billets ont de suite été référencés et apparaissaient correctement dans le résultat des recherches de tags directement sur le site Technorati. Or, depuis quelques mois, plus aucun de mes nouveaux billets n'apparait ! J'ai bien entendu vérifié qu'il n'y avait pas de problème technique de mon côté, mais à priori tout fonctionne très bien. La preuve, et c'est ça qui est encore plus étrange, si vous affichez mon blog sur Technorati, tous les billets sont présents, y compris les plus récents. Et lorsqu'on clique sur ces billets, les tags Technorati que j'insère sont bien présents et fonctionnels.

Conclusion: pourquoi Technorati ne fait plus apparaitre mes billets dans la recherche de tags alors qu'il les a bel et bien identifiés ?
Je ne suis pas le seul dans ce cas. Des blogs bien plus consultés que le mien se sont déjà plaints du même problème, pendant des périodes plus ou moins longues. Les personnes concernées ont écrit à Technorati pour avoir une explication, ce que j'ai bien évidemment fait avant d'en arriver à écrire ce billet. Certains ont eu des réponses (une excuse de la part de Technorati évoquant un problème technique puis correction du problème), d'autres ont vu miraculeusement réapparaitre certains de leurs billets. Ce que je constate, c'est que les blogs sur lesquels le problème est arrivé ont vu leurs billets ré-indexés à partir du moment qu'ils ont écrit un billet sur le sujet dans leur blog ! Je fais donc de même ... en croisant les doigts. A moins que vous ayez une solution à me proposer ?

D'ailleurs, je me permets de faire une petite remarque à ce sujet: au moment où j'écris ce billet, il y a 304 billets tagués "intelligence économique" et 122 "intelligence economique" dans Technorati. J'ai vraiment du mal à croire qu'il n'y ait que si peu de billets tagués avec ces termes. Ne serait-ce que sur mon blog, avant que le problème apparaisse, j'avais déjà plus d'une centaine de billets tagués "intelligence économique". Quand je vois la quantité de billets écrits sur le sujet par Vedocci, Spyworld-actu ou encore François Jeanne-Beylot (bien référencés sur Technorati) pour ne citer que eux, les résultats donnés par Technorati me laissent perplexe.

Liens


Photo 1 - source/copyright Technorati


Photo 2 - source/copyright Technorati

Tags:   ::   ::  

lundi 7 janvier 2008

Logiciels en ligne et sécurité

D'après ce que j'ai pu lire sur Internet ou dans les magazines spécialisés, la tendance pour 2008 est aux logiciels gratuits en ligne. On connaissait entre autres media-convert, pour convertir en ligne les fichiers de presque n'importe quelle extension vers n'importe quelle autre extension du même type, Google Documents, suite bureautique avec fonctionnalités collaboratives, etc., voici maintenant Ulteo.
Ulteo propose d'utiliser en ligne l'excellente suite bureautique Open Office (version 2.3) et comme Google Documents, permet l'utilisation de fonctionnalités d'édition collaborative. Un espace de stockage de 1 Go est par ailleurs proposé aux utilisateurs (nécessite un enregistrement). Autre détail, qui a son importance, Ulteo signale qu'il redistribuera une partie de ses bénéfices à des organismes humanitaires et écologiques. Une mesure pas très courante qui méritait d'être signalée.

Si l'idée de ces logiciels en ligne d'une manière générale est vraiment bonne, je me pose de plus en plus de questions quant à la sécurité/confidentialité des informations que l'on y dépose, sans parler du fait que dans un contexte professionnel il ne me paraitrait pas très sûr de stocker via ces services des informations importantes s'il s'agit de services gérés par des sociétés étrangères. Bien évidemment, pour chacun des logiciels, je suppose qu'une charte de confidentialité a été rédigée et que la sécurité doit être au maximum (concernant Ulteo, au moment où j'écris ce billet, la charte de confidentialité n'est pas encore accessible). D'ailleurs, il suffirait qu'un seul utilisateur se plaigne de la fuite avérée de certaines informations déposées pour que ces services aient de sérieux problèmes, ne serait-ce que de crédibilité.

Pour le moment, ces services, tels quels, sont à mon avis surtout pratiques pour "dépanner" lorsqu'on est sur un ordinateur "public/partagé" et qu'on ne manipule pas des données stratégiques. Dans le cadre d'une utilisation personnelle, chacun pourra estimer l'importance des données qu'il manipule. Quoiqu'il en soit, quitte à utiliser une suite bureautique en ligne, je ferai plutôt confiance à Ulteo (à confirmer lors de la mise en ligne de la charte de confidentialité) plutôt qu'à Google.
Ces outils deviendraient vraiment très intéressants en termes de travail collaboratif pour une grande entreprise s'ils étaient installés sur un Intranet coupé de l'extérieur.

Si vous souhaitez avoir une suite bureautique toujours à disposition et fonctionnant même lorsque vous êtes coupés d'Internet, je ne saurai trop recommander d'utiliser la version portable d'Open Office sur une clé USB ou autres supports amovibles et de stocker sur cette clé les documents sur une partition cryptée, créée par exemple avec TrueCrypt (penser à transporter le programme d'installation de TrueCrypt sur votre clé).

Liens

Tags:   ::   ::   ::   ::   ::   ::   ::   ::   ::  

Creative Commons License
Sauf indication, le contenu de ce site est placé sous licence Creative Commons.
OlivierPommeret.com © 2006 - © 2008
Propulsé par DotClear