yahoo-pipes

Le problème que posent les offres d’emploi en ligne pour les candidats, est leur dispersion sur les différents sites d’emploi. Nous allons donc essayer de les rassembler sur une seule page dans notre navigateur Web.

Pour agréger les offres d’emploi qui nous intéressent, nous pouvons faire de deux manières différentes, mais toujours en utilisant les ressources des flux RSS. Ce format, très pratique pour effectuer une veille sur n’importe quel sujet, est encore méconnu de la majorité des internautes bien qu’il se présente souvent sous leur nez sous la forme d’un icône caractéristique de couleur orange, avec des ondes qui se propagent d’un point situé dans son coin gauche ou droit. Les navigateurs Web modernes signalent aussi dans leur barre d’adresse l’existence d’un ou plusieurs flux RSS lorsqu’on voit une page Web. Comme ce format fait appel au langage XML, il offre aux utilisateurs d’innombrables possibilités de manipulation, qui vont servir à discriminer les offres d’emploi qui nous intéressent.

On peut directement agréger les flux RSS dans son navigateur, mais il est plus intéressant de passer par un système de XML Parsing comme Yahoo Pipes, afin d’obtenir un bon taux de discrimination par rapport à ce qui se présente sur un site d’offres d’emploi. Une deuxième raison pour mettre à profit Yahoo Pipes est dans la fermeture progressive de services pas assez utilisés chez Yahoo, or celui-ci s’avère réellement utile pour jouer avec le XML sans avoir les compétences d’un développeur informatique. Dans la pratique, et comme nous allons le voir, les sites d’emploi offrent déjà une certaine variété dans la discrimination de leurs offres d’emploi, mais nous allons pousser encore plus loin cette opportunité avec les pipes, tuyaux en anglais. Dans un deuxième temps, nous pourrons nous en servir pour faire des candidatures automatiquement comme avec un robot spammeur.

L’utilisation de Yahoo Pipes n’est pas une nouveauté, puisque des articles en font déjà mention dès 2007 pour la recherche d’emploi, dans l’objectif d’établir une veille performante. Cette application a été mise en service le 7 février de cette même année, en proposant une interface graphique avec l’objectif de réaliser une analyse exhaustive de fichiers XML sans avoir à écrire une ligne de code. Pour ce qui nous concerne, nous analyserons les flux RSS de Twitter et de 3 sites d’emplois pour réaliser un flux de veille sur les offres d’emploi que nous avons juste choisis dans l’ordre d’arrivée d’une requête saisie sur Google. Beaucoup d’offres d’emploi sont parues sur ce réseau social de micro-blogging, postées pour toutes sortes de jobs. Nous avons choisi de chercher celles qui concernent les professions de la vente, mais toutes sont représentées. Dans le champ de recherche, on doit saisir une liste de mots clés séparés par AND et OR afin de discriminer la recherche :

emploi OR recrute OR recherche AND commercial OR vente lang:fr -rt -prêt -mode

emploi AND commercial OR recrute AND commercial OR recherche AND commercial OR recrute AND vente OR emploi AND vente OR recherche AND vente lang:fr -rt -prêt -mode

Il est possible d’utiliser le formulaire de recherche avancée de Twitter, ce qui n’est finalement pas très pratique, car il n’exonère pas le choix de ces opérateurs de discrimination. Nous avons restreint le champ de recherche aux offres publiées en langue française, en éliminant les retweets. Dans la barre d’adresse apparaît une URL :

https://twitter.com/search?q=emploi%20OR%20recrute%20OR%20recherche%20AND%20commercial%20OR%20vente%20lang%3Afr%20-rt%20-prêt%20-mode&src=typd

Que nous allons modifier pour obtenir le flux RSS de cette recherche. On ne conserve que la partie après le ?q (query string) pour obtenir le flux :

http://search.twitter.com/search.atom?q=emploi%20OR%20recrute%20AND%20commercial%20OR%20vente%20lang%3Afr%20-rt%20-prêt%20-mode&src=typd

Pour les sites d’emploi la procédure est beaucoup plus simple, puisqu’il y en a beaucoup à proposer un flux RSS à l’issue d’une recherche d’emploi sur le site. Sur Monster, on demande à parcourir les offres d’emploi, et on sélectionne des critères. L’accès au flux est proposé en haut de la liste. Le site de l’APEC propose un flux correspondant à certains critères définis à l’avance, tandis que Cadremploi propose de créer un flux RSS à partir de sa recherche (cf. les captures d’écran). Malheureusement, tous les sites ne proposent pas de flux RSS, pour une raison ou pour une autre, comme les sites de Qapa ou du Pôle emploi. La raison en est généralement qu’ils ont dans l’idée de fidéliser ainsi les visiteurs.

Une fois les différents flux RSS obtenus, on ouvre un compte chez Yahoo pour bénéficier gratuitement du service de Pipes. La documentation est en anglais, mais nous n’avons pas besoin de pousser très loin ses possibilités offertes par ce système de manipulation des flux. Ouvrons une séquence à gauche avec Fetch Feed, et saisissons les URL dans une boîte de dialogue qui nous est proposée. Nous avons peu de choses à discriminer, les @ des direct messages de Twitter et les ressources en double avec l’opérateur dit Unique. On réunit nos deux séries de flux RSS avec Union et on demande la sortie du flux généré avec la date la plus récente en premier. Je n’ai pas l’ambition, ni la prétention d’écrire un guide pour utiliser les pipes à fond dans la mesure où d’excellentes ressources existent déjà sur le Web. Vous pouvez néanmoins utiliser les commentaires pour revenir sur un point qui serait resté obscur. Nous avons désormais notre flux RSS recensant toutes les offres d’emploi pour la vente et les commerciaux. Un outil de veille digitale pratique à domicile !

Nous aurions pu nous contenter d’agréger tous les flux dans le navigateur si nous n’avions pas une autre idée à l’esprit, qui est d’utiliser le flux pour écrire un programme qui permettra d’y répondre automatiquement. Mais c’est l’objet d’un autre et futur article ! Si vous ne voulez pas le manquer, n’oubliez pas de vous abonner à notre flux RSS.

Réagissez à cet article ! Notez que les commentaires sont en dofollow sur Vite CV, pour vous aider dans le référencement de votre site Web en postant plus de commentaires sur les blogs.

  • 2287