Millions of Workers Are Training AI Models for Pennies

En 2016, Oskarina Fuentes a obtenu un pourboire d'un ami qui semblait trop beau pour être vrai. Sa vie au Venezuela était devenue une lutte: l'inflation avait frappé 800% sous le président Nicolás Maduro, et Fuentes, 26 ans, n'avait pas de travail stable et équilibrait plusieurs bousculades pour survivre.

Son amie lui a parlé à propos d'Appen, une société australienne de services de données qui recherchait des travailleurs externalisés pour marquer des données de formation pour les algorithmes d'intelligence artificielle. La plupart des internautes auront fait une forme d'étiquetage de données: identifier les images de feux de circulation et de bus pour les captchas en ligne. Mais les algorithmes alimentant de nouveaux robots qui peuvent passer des examens juridiques, créer des images fantastiques en quelques secondes ou supprimer du contenu nuisible sur les réseaux sociaux sont formés sur des ensembles de données – images, vidéo et texte – étiquetés par les travailleurs de l'économie de Gig sur certains des marchés du travail les moins chers du monde.

Les clients d'Appen ont inclus Amazon, Facebook, Google et Microsoft, et les 1 millions de contributeurs de la société ne sont qu'une partie d'une vaste industrie cachée. Le marché mondial de la collecte et de l'étiquetage des données était évalué à 2,22 milliards de dollars en 2022 et devrait atteindre 17,1 milliards de dollars d'ici 2030, selon le cabinet de conseil Grand View Research. Alors que le Venezuela se glissait dans une catastrophe économique, de nombreux Vénézuéliens formés par l'université comme Fuentes et ses amis ont rejoint des plateformes de crowdsourcing comme Appen.

Pendant un certain temps, c'était une bouée de sauvetage: Appen signifiait que Fuentes pouvait travailler à domicile à n'importe quelle heure de la journée. Mais ensuite, les pannes de courant ont commencé – la puissance de la puissance pendant des jours. À gauche dans l'obscurité, Fuentes n'a pas pu ramasser les tâches. «Je ne pouvais plus le supporter», dit-elle, parlant en espagnol. “Au Venezuela, vous ne vivez pas, vous survivez.” Fuentes et sa famille ont émigré en Colombie. Aujourd'hui, elle partage un appartement avec sa mère, sa grand-mère, ses oncles et son chien dans la région d'Antioquia.

Appen est toujours sa seule source de revenus. La rémunération varie de 2,2 cents à 50 cents par tâche, dit Fuentes. En règle générale, une heure et demie de travail rapportera 1 $. Lorsqu'il y a suffisamment de tâches pour travailler une semaine complète, elle gagne environ 280 $ par mois, remplissant presque le salaire minimum de la Colombie de 285 $. Mais remplir une semaine de tâches est rare, dit-elle. Les jours en bas, qui sont devenus de plus en plus courants, ne rapporteront pas plus de 1 $ à 2 $. Fuentes travaille sur un ordinateur portable de son lit, collée à son ordinateur pendant plus de 18 heures par jour pour obtenir le premier choix de tâches qui pourraient arriver à tout moment. Compte tenu des clients internationaux d'Appen, les jours commencent lorsque les tâches sortent, ce qui peut signifier 2 heures du matin.

C'est un modèle qui se répète dans le monde en développement. Étiqueter des points chauds en Afrique de l'Est, au Venezuela, en Inde, aux Philippines et même aux camps de réfugiés au Kenya et au Liban, les camps de Shatila offrent une main-d'œuvre bon marché. Les travailleurs ramassent des microtasses pour quelques cents chacun sur des plateformes comme Appen, Clickworker et Scaled IA, ou signer des contrats à court terme dans des centres de données physiques comme le bureau de 3000 personnes de Sama à Nairobi, Kenya, qui a fait l'objet d'un Temps enquête dans l'exploitation des modérateurs de contenu. Le boom de l'IA dans ces endroits n'est pas une coïncidence, explique Florian Schmidt, auteur de Marchés de travail numériques dans l'économie de la plate-forme. «L'industrie peut se déplacer de manière flexible où les salaires sont les plus bas», dit-il, et peut le faire beaucoup plus rapidement que les fabricants de textiles.