Mais de 700.000 obras provenientes de um site de autopublicação
Naro FanDB, uma conta não oficial do fã X (anteriormente Twitter) do site japonês de novelas Shōsetsuka ni Narō, postou em 27 de abril que um conjunto de dados público do O projeto RyokoAI retirou cerca de 711.700 trabalhos do site. Conjuntos de dados podem ser usados para o treinamento de IA. modelos.
Internautas questionaram a ética do uso de obras de Shōsetsuka ni Narō, que podem ser vistas publicamente sem registrar uma conta.
Os termos de uso de Shōsetsuka ni Narō proíbem os usuários de se envolverem em quaisquer atos que possam infringir o direitos autorais, marcas registradas ou outros direitos de propriedade intelectual dos mantenedores do site Hina Project ou de outros usuários. Os usuários podem ler obras no site sem concordar com os termos de uso, mas as leis de propriedade intelectual ainda podem ser aplicadas sem os termos de uso.
A isenção de responsabilidade de licenciamento do conjunto de dados afirma que todo o material, exceto aqueles criados pelos próprios Ronsor Labs ou pelo próprio Ryoko AI Production Committee,”é distribuído sob princípios de uso justo”. No entanto, a atual Lei de Direitos Autorais do Japão e leis semelhantes em outros países não incluem a doutrina do uso justo conforme codificada nos Estados Unidos.
O conjunto de dados de 65 gigabytes é dividido em 21 segmentos, e a ANN confirmou que pelo menos cinco dos segmentos contenham texto de Shōsetsuka ni Narō.
RyokoAI descreve a empresa como”comprometido em produzir soluções de IA de código aberto e lançar modelos de código aberto, conjuntos de dados e muito mais.”
Fontes: Twitter do Naro Fan DB conta, Abraçando o rosto via Comic Recursos do livro