Przeszkody etyczne w użyciu prac ze strony Shōsetsuka ni Narō w celach treningu sztucznej inteligencji

Naro FanDB, nieoficjalne konto fanów na Twitterze dla japońskiej strony internetowej z powieściami Shōsetsuka ni Narō, opublikowało 27 kwietnia, że publiczny zbiór danych z projektu RyokoAI zgromadził około 711 700 prac ze strony internetowej. Zbiory danych mogą być wykorzystywane do szkolenia modeli sztucznej inteligencji.

Użytkownicy Internetu zaczęli kwestionować etykę korzystania z prac ze strony Shōsetsuka ni Narō, które są publicznie dostępne bez konieczności rejestracji.

Regulamin strony Shōsetsuka ni Narō zabrania użytkownikom angażowania się w jakiekolwiek działania naruszające prawa autorskie, znaki towarowe lub inne prawa własności intelektualnej twórców strony Hina Project lub innych użytkowników. Użytkownicy mogą czytać prace znajdujące się na stronie bez zgody na regulamin, ale prawa własności intelektualnej nadal mogą mieć zastosowanie.

W oświadczeniu o licencji zbioru danych stwierdza się, że „wszelki materiał oprócz tych stworzonych przez Ronsor Labs lub Komitet Produkcji Ryoko AI” jest dystrybuowany zgodnie z zasadami fair use. Jednak obecnie obowiązujące prawo autorskie w Japonii i podobne przepisy w innych krajach nie obejmują doktryny fair use, jak to zostało uregulowane w Stanach Zjednoczonych.

65-gigabajtowy zbiór danych jest podzielony na 21 segmentów, a ANN potwierdziło, że co najmniej pięć z tych segmentów zawiera teksty ze strony Shōsetsuka ni Narō.

Opowieści ze strony Shōsetsuka ni Narō często są wybierane przez wydawców do wydania drukiem lub cyfrowo, a niektóre tytuły są adaptowane na mangę i anime, takie jak seria powieści ilustrowanych „The Irregular at Magic High School” autorstwa Tsutomu Satou.

RyokoAI opisuje swoją działalność jako „zaangażowaną w tworzenie rozwiązań sztucznej inteligencji na zasadzie open-source i udostępnianie otwartych modeli, zbiorów danych i nie tylko”.

Źródła: Konto Twitter Naro Fan DB, Hugging Face za pośrednictwem Comic Book Resources