Comment l’intelligence artificielle aide à identifier des milliers de soldats inconnus de la guerre civile

Samuel Holmes Doten, de Plymouth, Mass, est né le 5 juin 1812, si bien qu’après la fin de la guerre civile en 1865, il plaisantait en disant qu’il avait « servi dans l’infanterie dans la guerre de cette date ».

William Kendall Crossfield, originaire de Peterborough, N.H., se reposait pendant la bataille de Fredericksburg quand il a été abattu d’une balle dans le cou en se retournant. La couverture qu’il avait remontée jusqu’au menton a miraculeusement amorti la balle, mais il s’est évanoui sous le choc du coup.

Vermonter Almeron C. Inman a été recommandé pour la médaille d’honneur du 9 février 1887, « pour son sang-froid intelligent et sa bravoure » dans deux engagements de 1864. Après avoir disparu pendant trois mois en 1895, il a été retrouvé mort, on pense qu’il s’est suicidé.

Les trois hommes avaient des histoires différentes de la guerre civile, mais ils avaient aussi quelque chose en commun : comme beaucoup de ceux qui ont combattu pendant ce conflit, ils ont été photographiés en uniforme. De multiples copies des photos ont été faites, et certains sont devenus détachés des informations d’identification. Leurs visages sont devenus des symboles sans nom plutôt que de faire partie de vies concrètes. Et peu de ces photos ont fini chez David Morin à Exeter, N.H., qui se targue d’une collection de plus de 260 photos militaires de la guerre de Sécession.

Jusqu’à présent, ces trois hommes restaient un mystère pour lui – mais au cours de l’année dernière, il les a identifiés en utilisant Civil War Photo Sleuth, un site web qui utilise la technologie de reconnaissance faciale, une forme d’intelligence artificielle (IA), pour identifier les hommes sur ces photos. Et en 2020, le site prévoit d’ajouter une nouvelle fonctionnalité, après un test réussi : un moyen pour les utilisateurs d’obtenir un deuxième avis sur les correspondances potentielles des photos.

« Aujourd’hui, l’histoire est tellement mieux documentée et les chances que les choses survivent sont tellement plus grandes », dit Morin.

Alors que la guerre de Sécession a commencé il y a 158 ans, le marché des collections de photographies de la guerre de Sécession est relativement nouveau, selon Ron Coddington, l’un des collaborateurs du site et l’éditeur et rédacteur en chef du magazine Military Images. Il existe des photos de conflits militaires américains antérieurs, mais la guerre de Sécession est considérée comme la première guerre systématiquement photographiée, inaugurant une nouvelle ère de photojournalisme en Amérique. Mais lorsque le centenaire du début de la guerre de Sécession est arrivé en 1961, entraînant une nouvelle vague d’intérêt pour le conflit chez les passionnés d’histoire, les albums de cette période étaient de plus en plus détenus par des collectionneurs plutôt que par des familles privées. Dans cette transition, de nombreuses informations sur les images ont été perdues. Bien que des livres sur les photographies de la guerre civile, avec des informations biographiques de base, aient commencé à sortir dans les années 80, de nombreux collectionneurs n’avaient aucun moyen facile d’apprendre les noms des personnes figurant sur les images qu’ils possédaient.

Ayez votre dose d’histoire en un seul endroit : inscrivez-vous à la newsletter hebdomadaire de TIME History

Le fondateur de Civil War Photo Sleuth, Kurt Luther, professeur d’histoire et d’informatique à Virginia Tech, s’est intéressé à la photographie de la guerre civile en 2013 après être tombé sur un album photo contenant une image de son arrière-arrière-grand-oncle, qui a servi dans la compagnie E du 134e de Pennsylvanie, dans une exposition sur le rôle de la Pennsylvanie dans la guerre civile au Senator John Heinz History Center de Pittsburgh. En commençant à en savoir plus sur ces photos, il a commencé à imaginer un Wikipédia pour les photos de la guerre civile – une ressource que n’importe qui pourrait enrichir, ce qui aiderait à comprendre qui étaient les hommes sur les photos.

« Les collections ne savent souvent pas ce qu’elles ont », dit-il. « Elles ont des photos de la guerre civile, et elles ne savent même pas comment elles les ont obtenues. »

Le résultat est Civil War Photo Sleuth.

Lorsque les utilisateurs téléchargent une photo sur le site, ils peuvent cocher des tags sur la couleur du manteau de l’uniforme, ou du moins s’il est « foncé » ou « clair », pour séparer les forces de l’Union et les forces confédérées. L’utilisateur peut indiquer si l’image a une « marque arrière », qui contient souvent le nom et le lieu du photographe, et s’il y a un timbre fiscal – un indice clé, car le gouvernement a taxé les photos de 1864 à 1866 pour financer la guerre. En outre, il est demandé aux utilisateurs s’il y a un insigne sur le chapeau ou le col, ainsi que s’ils notent des rayures ou des chevrons sur l’uniforme et combien, ce qui peut dénoter le grade de l’homme.

Similaire à l’application virale de Google qui trouvait des œuvres d’art ressemblant aux selfies des utilisateurs, la technologie de reconnaissance faciale de Civil War Photo Sleuth utilise un ensemble de 27 repères faciaux, tels que les coins de la bouche ou le bout du nez, pour analyser une photo donnée. Les visages ayant des proportions différentes, le logiciel calcule diverses distances entre les points de repère du visage dans le portrait téléchargé – comme la distance entre la pupille gauche et la pupille droite – et recherche ensuite des photos présentant des distances similaires entre les différents traits du visage. (Parfois, la décoloration ou les trous dans ces vieilles images peuvent masquer ces points de repère faciaux et empêcher les identifications.)

Le site tire ensuite les images précédemment téléchargées qui correspondent à la nouvelle, avec l’espoir que l’une des correspondances aidera à identifier l’homme sur la photo.

Plus le nombre de photos téléchargées est élevé, plus la probabilité de trouver une correspondance est grande, et l’équipe de Civil War Photo Sleuth ajoute des photos de la Bibliothèque du Congrès et d’autres collections pour augmenter la probabilité de correspondances. Depuis le lancement en août 2018, près de 30 000 photos ont été ajoutées au site par près de 14 000 utilisateurs enregistrés, dont des employés de la Bibliothèque du Congrès et des Archives nationales. Un peu plus de 3 300 identifications ont été réalisées, notamment des photos présentes dans les collections de la Bibliothèque publique de New York, de la Société historique du Massachusetts et du musée Henry Ford dans le Michigan. Le site a également remporté le Cloud AI Research Challenge de Microsoft, doté de 25 000 dollars, ainsi qu’une subvention de la National Science Foundation.

Mais malgré la technologie avancée, la recherche humaine reste essentielle pour confirmer les résultats de l’appli. Par exemple, lorsque Morin a téléchargé la photo d’un sous-lieutenant non identifié de l’Union avec une marque arrière de Manchester, N.H., il a été surpris de voir que le résultat le plus recommandé du site était William H. Baldwin, qui a servi dans un régiment de génie de New York au lieu d’un régiment du New Hampshire. Des recherches plus approfondies ont montré qu’il était originaire du New Hampshire, mais qu’il avait servi à New York.

Lorsque le collectionneur du New Hampshire Dave Morin a téléchargé une photo, le résultat le plus recommandé était William H. Baldwin, qui a servi dans un régiment d’ingénieurs de New York.
Courtesy of Ron Coddington

Le système n’est pas parfait : les identifications suggérées par le site peuvent être simplement les meilleures suppositions d’un autre téléchargeur, et il n’est pas clair si chaque utilisateur a fait des recherches de suivi pour confirmer les identifications. Mais d’après une étude sur un mois d’activité, menée par Luther et son équipe, le taux de précision est estimé entre 75 % et 80 %.

Et les collectionneurs ont une raison de vouloir élargir la base de données, au-delà de la simple curiosité, car les photos identifiées se vendent mieux. « La valeur de l’image augmente de 50 % », explique Tom Liljenquist, qui collecte pour sa famille plus de 2 500 portraits.

Les motivations de Luther sont également altruistes. Les personnes à l’origine du site espèrent qu’en identifiant les photos de la guerre civile, elles feront également apparaître de nouvelles façons de raconter cette histoire – y compris, dit Coddington, les façons dont cette technologie peut être appliquée aux histoires et aux photos de femmes et de personnes de couleur, car l’histoire de la guerre civile est souvent racontée du point de vue des soldats blancs de l’Union.

« Nous sommes allés à la guerre et c’était dévastateur, et je ne peux pas m’empêcher de penser que, si nous étions en mesure d’être exposés à ces histoires du tribut, du prix que nous avons payé pour cela », dit Coddington, « nous pourrions penser différemment sur la façon dont nous résolvons nos différences. »

Recevez notre bulletin d’information sur l’histoire. Mettez les nouvelles d’aujourd’hui en contexte et voyez les faits saillants des archives.

Merci !

Pour votre sécurité, nous avons envoyé un email de confirmation à l’adresse que vous avez saisie. Cliquez sur le lien pour confirmer votre abonnement et commencer à recevoir nos newsletters. Si vous ne recevez pas la confirmation dans les 10 minutes, vérifiez votre dossier spam.

Ecrire à Olivia B. Waxman à l’adresse [email protected].

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *