Data Science prägt zunehmend unsere Welt, von den Informationen, die wir lesen, über die Auswahl für ein Vorstellungsgespräch bis hin zur Länge der Haftstrafe. Da die Menge an Daten, die wir sammeln und analysieren, exponentiell zunimmt, sehen wir allmählich beunruhigende Folgen: Algorithmen, die soziale Vorurteile verstärken, Bedrohungen unserer Privatsphäre, die Verbreitung gefälschter Nachrichten und sogar die Bewaffnung von Desinformation für den Einsatz in der Cyberkriegsführung.
Bisher hat sich unser Ansatz zur Datenwissenschaft nachträglich mit sozialen und ethischen Bedenken befasst. Die Denkweise „Move Fast and Break Things“ ermutigt die Menschen, zuerst technische Herausforderungen anzugehen und sich dann später auf menschliche Auswirkungen und unbeabsichtigte Folgen (falls vorhanden) zu konzentrieren. In den letzten Jahren haben Technologieunternehmen damit begonnen, Ethiker und Sozialwissenschaftler einzustellen, aber sie werden oft von den Technologieteams isoliert und ihre Warnungen werden ignoriert. Die Facebook-Whistleblowerin Frances Haugen hat das Unternehmen enthüllt handelte nicht auf interner Forschung, die zahlreiche Schäden identifiziert, die durch seine Algorithmen verursacht werden, von der Förderung von Hassreden auf der ganzen Welt bis hin zu zunehmenden Problemen mit dem Körperbild bei Teenagern.
Stattdessen müssen wir menschliche Perspektiven durch Data Science integrieren. Menschen berühren jeden Schritt des Data-Science-Prozesses, von der Erfassung der Daten über ihre Kategorisierung, Kennzeichnung und Manipulation bis hin zu dem, wofür sie verwendet werden. Kein Teil der Datenwissenschaft ist wertneutral. Deshalb bauen meine Kollegen und ich Menschenzentrierte Datenwissenschaftein neues interdisziplinäres Feld, das Informatik, Sozialwissenschaften und Mensch-Computer-Interaktion verbindet.
Um die Datenwissenschaft menschenzentrierter zu machen, müssen wir Datenwissenschaftler ausbilden und fördern, die es sind π-förmig. In der Hochschulbildung sprechen wir darüber T-förmige Wissenschaftler die in einem Bereich vertieft sind und in mehreren anderen Bereichen, einschließlich der Sozial- und Geisteswissenschaften, ein breites Verständnis haben. Dies gilt als Verbesserung gegenüber I-förmigen Menschen, die nur über eine sehr schmale Wissensbasis verfügen.
Aber T-förmig zu sein ist nicht genug. Wir brauchen π-förmige Data Scientists mit einem tiefen Verständnis für die technischen und menschlichen Aspekte ihrer Arbeit. So wie ein Arzt seine Arbeit nicht effektiv erledigen kann, wenn er nicht weiß, wie er mit Patienten interagieren soll, müssen Datenwissenschaftler ein gründliches Verständnis der sozialen und ethischen Auswirkungen ihrer Tätigkeit haben. Dies negiert nicht den Wert, engagierte Ethiker und Sozialwissenschaftler in einem Team zu haben, ersetzt aber nicht die Notwendigkeit, dass Datenwissenschaftler selbst eine menschenzentrierte Perspektive haben.
Es gibt viele Möglichkeiten für π-förmige Menschen, Data Science menschenzentrierter zu gestalten. Einer meiner Co-Autoren über das neue Buch Menschenzentrierte Datenwissenschaft, Shion Guha, nutzte diesen Ansatz in seiner Arbeit mit einer großen städtischen Polizeidienststelle, um die Vorurteile zu identifizieren und zu überwinden, die sich auf Kriminalitätskarten auswirken. Durch die Kombination von Informationswissenschaft und Statistik und das Eintauchen in die menschliche Seite des Kriminalitätskartierungstools, nicht nur in die technischen Komponenten, bemerkte Guha, dass das Modell eine veraltete gesetzliche Definition dessen verwendete, was Straftaten ausmacht: sexuelle Übergriffe. Dies führte zu ungenauen Karten von Sexualdelikten in der Stadt, die sich darauf auswirkten, wie Beamte auf Beschwerden über sexuelle Übergriffe reagierten und wie Beschwerden in Polizeidatenbanken erfasst wurden. Sobald der Fehler identifiziert war, konnte sich die Polizei ein genaueres Bild von sexuellen Übergriffen in ihrer Stadt machen und entsprechend reagieren.
In Pictures Ltd./Corbis über Getty Images
Während einige Kritiker die humanistische Seite als weich oder unpräzise beschreiben, zeigt Guhas Arbeit – zusammen mit der vieler anderer –, dass diese Perspektiven die Datenwissenschaft tatsächlich strenger und präziser machen. Die Idee, dass eine menschliche Perspektive das Gegenteil von technischer Strenge ist, ist eine falsche Dichotomie (etwas, worüber ich eher sprechen werde Hauptredner zu Weltkonferenz für Frauen in der Datenwissenschaft (WiDS) 7. März). In der Tat verbessert die Menschenorientierung unsere Fähigkeit, die Welt um uns herum durch Daten genau darzustellen.
Human Centricity kann Data Science rigoroser machen, indem Benutzer und andere Interessengruppen in die Datenanalyse einbezogen werden behandeln technische Werkzeuge zu entwerfen. Zu verstehen, wie Benutzer denken, kann uns dabei helfen, innovative Ansätze zur Präsentation von Daten zu finden, die Menschen leichter verstehen und verwenden können. Bei Human-Centered Data Science Lab Ich laufe an der University of Washington, wir haben das angefangen Verkehr Projekt, um intuitivere Karten zu erstellen. Anstatt Ihnen zu zeigen, wie weit ein Ort in Meilen entfernt ist, zeigen diese Karten, wie lange Sie brauchen, um dorthin zu gelangen, basierend auf Ihrem Standort, dem aktuellen Verkehr und den Optionen für öffentliche Verkehrsmittel.
Human-Centered Data Science bezieht häufig quantitative und qualitative Methoden und Ansätze aus der Informatik und den Sozialwissenschaften ein. In meinem Labor haben wir entwickelt mehrere Werkzeuge um Sozialwissenschaftlern bei der Analyse qualitativer Daten wie Text-Chats und Social-Media-Posts zu helfen. Herkömmliche Methoden dauern zu lange, um große Textmengen zu organisieren und zu analysieren, aber unsere Apps beschleunigen den Prozess durch die Verwendung von Visualisierung, einer der effizientesten Methoden für Menschen, große Mengen an Informationen aufzunehmen. Diese hybriden Konversationsanalyse-Tools wurden mit Erkenntnissen aus der Psychologie kombiniert, um Fragen zu untersuchen, z. B. wie Menschen zusammenarbeiten und interagieren bei der Remote-Arbeit, indem sie ihre Chat-Protokolle analysieren.
Wir müssen dringend überdenken, was es bedeutet, ein guter Data Scientist zu sein, und erkennen, dass es nicht nur um technische Fähigkeiten geht. Jedes Unternehmen, das Data Science nutzt – und das sind mittlerweile fast alle – muss vorrangig π-förmige Menschen mit technischem und sozialwissenschaftlichem Hintergrund einstellen, fördern und unterstützen, bis C. Hochschulen ethische Perspektiven und sozialwissenschaftliche Ausbildung in ihre Daten integrieren sollten Lehrpläne für Naturwissenschaften und künstliche Intelligenz. Sowohl für Studierende als auch für die Gesellschaft als Ganzes wird es zunehmend unverantwortlich, die nächste Generation von Datenwissenschaftlern nicht zu schulen, damit sie ein differenziertes Verständnis für die Auswirkungen ihrer Algorithmen auf die Gesellschaft haben.
Da die Datenwissenschaft einen immer größeren Einfluss auf unser Leben ausübt, werden die gesellschaftlichen Folgen nur noch komplizierter und die Einsätze steigen. Der Druck der Öffentlichkeit und der politischen Entscheidungsträger, Probleme wie algorithmische Voreingenommenheit und Fehlinformationen anzugehen, wird weiter zunehmen. Jede zukunftsorientierte Institution, die in fünf bis zehn Jahren wettbewerbsfähig sein will, muss der menschenzentrierten Datenwissenschaft jetzt Priorität einräumen.
Dr. Cecilia Aragon ist Professorin am College of Engineering der University of Washington und Direktorin der Human-Centered Data Science Lab. Sie wird die Grundsatzrede „The Rigorous and Human Life of Data“ auf der halten Weltkonferenz für Frauen in der Datenwissenschaft (WiDS) die am 7. März an der Stanford University stattfinden wird und in der Reihe. Sein neustes Buch ist Menschenzentrierte Datenwissenschaftvon MIT Press.
Die in diesem Artikel geäußerten Meinungen sind die des Autors.