Twitter заявил, что его алгоритм обрезки изображений на основе искусственного интеллекта, в конце концов, слегка смещен в пользу белых и женщин, и предпринял шаги, чтобы отказаться от кода машинного обучения.

Алгоритм использовался для автоматического определения того, какая часть фотографии, опубликованной в социальной сети, лучше всего подходит для просмотра на экране. Вы можете загружать изображения любых размеров и соотношений сторон; в какой-то момент изображения должны быть отображены, и Twitter использовал обученную систему, чтобы решить, какие части мультимедиа показывать. Была доступна возможность просмотра всего изображения — алгоритм использовался для создания превью медиафайла.

В частности, программное обеспечение полагалось на алгоритм заметности, предназначенный для сохранения наиболее интересных и актуальных частей изображения в кадре предварительного просмотра. Например, снимок людей на пляже должен фокусироваться на их лицах, а не на небе или песке.

Пользователи Твиттера, однако, заметили, что этот инструмент, когда ему давали возможность выбирать, казалось, нацелен на людей с более светлой кожей и женской грудью. После того, как в октябре соцсеть провела расследование по этому поводу, сообщается, что Реестр он не нашел никаких доказательств расовых или гендерных предубеждений, хотя признал, что его инженерам, вероятно, нужно было провести дополнительные тесты.

Теперь три технических специалиста из группы по этике, прозрачности и подотчетности машинного обучения и группы исследования понимания контента обнаружили, что алгоритм заметности на самом деле смещен в сторону белых и женщин.

Читайте также:
Wine выталкивает пробку на уровне совместимости Windows версии 6.0 для систем * nix °

Нам говорят, что программное обеспечение примерно на восемь процентов больше ориентировано на отображение женщин по сравнению с мужчинами и на четыре процента больше для людей с более светлой кожей по сравнению с людьми с более темной кожей. Когда эти группы были сужены по полу, было семь процентов разницы в пользу белых женщин по сравнению с чернокожими женщинами и два процента для белых мужчин по сравнению с черными мужчинами.

Разница кажется незначительной, но когда в Твиттере публикуются миллионы и миллионы фотографий, большое количество людей столкнется с предвзятостью.

Команда провела свои тесты, сравнивая то, как программное обеспечение обрабатывает изображения черных женщин, черных мужчин, белых женщин и белых мужчин, проведя эксперимент 10 000 раз. В предыдущем исследовании сотрудники изучали, как код «обрезал» белых людей против черных, белых против индейцев, белых против азиатских и мужчин против женщин, проведя тесты всего 200 раз. Небольшой размер выборки затруднил выявление каких-либо значительных уровней систематической ошибки.

Однако, похоже, не было явных доказательств того, что алгоритм фокусировался на частях тела людей, кроме их лиц.

«Мы обнаружили, что не более 3 из 100 изображений каждого пола имеют обрезку не на голове», — пояснили они в бумага поделился на arXiv на этой неделе. «Кропы не на головах были получены из-за высоких прогнозируемых выдающихся оценок на частях изображения, таких как номер на майке спортсменов или значок. Эти закономерности были одинаковыми для всех полов «.

Читайте также:
Река Менон из Accenture стала первой женщиной, возглавившей индийскую торговую организацию в сфере ИТ °

Возможно, проблемные посевы женских сундуков были вызваны логотипами или изображениями на их одежде, которые привлекли внимание кода.

С марта в Твиттере постепенно появился Обновить для пользователей смартфонов, чтобы его приложение не полагалось на алгоритм заметности, а вместо этого давало людям больше контроля над тем, как отображаются изображения. Короче говоря, Twitter теперь отображает «фотографии со стандартным соотношением сторон полностью на iOS и Android — то есть без обрезки алгоритма заметности» и «настоящий предварительный просмотр изображения в поле композитора твита, поэтому авторы твитов знают, как их твиты будут выглядеть раньше. они публикуют «.

«Мы рассмотрели компромисс между скоростью и согласованностью автоматизированного кадрирования с потенциальными рисками, которые мы увидели в этом исследовании», — сказал Румман Чоудхури, директор по разработке программного обеспечения в Twitter. сказал в среду.

«Один из наших выводов заключается в том, что не все в Твиттере является хорошим кандидатом для алгоритма, и в этом случае решение, как кадрировать изображение, лучше всего принимают люди».

Twitter заявил, что все еще работает над улучшением методов обрезки изображений для фотографий, отображаемых на его веб-сайте, и для нескольких фотографий. ®