Исследователи представили алгоритм, который определяет «оскорбительные» материалы для машинного обучения

Исследователи представили алгоритм, который определяет «оскорбительные» материалы для машинного обучения

В статье «Каковы предубеждения во встраивании слов?», опубликованной на сервере препринтов Arxiv.org, ученые из Microsoft Research, Карнеги-Меллон и Университета Мэриленда описывают алгоритм, который может выявить «оскорбительные ассоциации», связанные с деликатными вопросами — такими как гендер и раса.

Их работа основана на исследовании Калифорнийского университета, в котором подробно описывается учебное решение, способное «сохранять [гендерную информацию]» в словарных векторах, «заставляя другие аспекты быть свободными от гендерного влияния».

«Мы рассматриваем проблему подсчета неконтролируемого смещения (UBE), автоматически обнаруживая смещения смысла», — пишут исследователи. «Существует множество причин, по которым можно использовать такой алгоритм. Во-первых, социологи могут использовать его в качестве инструмента для изучения предвзятости человека. Во-вторых, выявление предвзятости является естественным шагом в «искажении» представлений. Наконец, это может помочь избежать систем, которые увековечивают эти предубеждения — мы бы не хотели исправлять их во множестве систем, которые позже окажутся на рынке».

Исследователи представили алгоритм, который определяет «оскорбительные» материалы для машинного обучения Ильнур Шарафиев

Компании Zoox разрешили беспилотные поездки в Калифорнии

«Невозможно вручную написать всевозможные тесты, чтобы проверить нейтральность материала для машинного обучения. Специалисты по предметным областям обычно создают такие тесты, и нецелесообразно ожидать, что они охватят все возможные группы, особенно если они не знают, какие группы представлены в их данных», — отмечают исследователи.

Чтобы протестировать систему, ученые взяли наборы слов из базы данных Администрации социального обеспечения (SSA), стараясь удалить из них слова, которые обладают сразу несколькими значениями. После того, как ИИ проверил нейтральность выражений, их повторно отсмотрели вручную. Оказалось, что алгоритм смог определить более 90% выражений, контекст которых был смещен и мог быть оскорбительным.

Подпишитесь на наши новости
Лого www.SiteHere.ru
1970-01-01 03:00 http://news.xtipe.com/ru/news/33372

Смотрите так же

Электроны при стимуляции светом движутся всего несколько фемтосекунд. Физики впервые успели снять их на камеру! 1970-01-01 03:00

Физики из Кильского университета впервые сняли движение электронов, продолжительность которого составляла несколько несколько фемтосекунд — квадрилионных долей секунды. Эксперимент позволит изучить поведение электронов и создать сверхбыстрые оптоэлектронные компоненты в будущем, пишет Eurek Alert.

Искусственное легкое превратит воду в водородное топливо 1970-01-01 03:00

Инженеры из Стэнфордского университета создали искусственное легкое, способное выделить из воды кислород и водород и превратить их в экологически чистое водородное топливо. Об этом пишет Science Alert.

Астрономы обнаружили древнее газовое облако, не загрязненное элементам взорвавшихся звезд 1970-01-01 03:00

Астрофизики из обсерватории Кека обнаружили древнее газовое облако, которое образовалось примерно во времена Большого взрыва. Объект, в отличии от других известных науке газовых облаков, не загрязнен остатками тяжелых элементов от взорвавшихся звезд — ученые наблюдают это впервые.

Facebook закрыл проект по борьбе с токсичными высказываниями 1970-01-01 03:00

Facebook закрыл проект Common Ground, который позволил бы повысить терпимость между пользователями с различными политическими взглядами — в их ленте чаще оказывались бы посты с отличающимся от их собственного мнением по острым вопросам. Об этом пишет The Wall Street Journal.

В Калифорнии высадили секвойи, клонированные из древних пней 1970-01-01 03:00

Некоммерческая организация Archangel Ancient Tree Archive высадила в лесу Президио недалеко от Сан-Франциско 75 секвой, геном которых создан на основе ДНК древних пней возрастом более 3 тыс лет. Об этом пишет Motherboard.