Research @ Mangaki Recommandation d'anime et de mangas

Wanna join? Contact us or say hi on Twitter!


Archives

How To Securely Share Information

We are writing a recommender system. Let’s give a typical use case.

Deep Learning for Anime & Manga

Download the slides

From fiction to reality

De la fiction est née la réalité. Ne l’oublie jamais.
It’s truth that came from fiction. Always remember that.” – Paprika

Mangaki on Earth (MoE): visualize anime embeddings

So actually in Mangaki, our algorithms allow us to learn a latent representation (also called embedding) of every anime or manga and every user, so that people like anime in their direction.

AI for Manga & Anime

At Anime Expo 2018 in Los Angeles, we gave the keynote AI for Manga & Anime (AIMA_AX)!

AI for Manga & Anime (AIMA)

We are pleased to give a keynote at the Anime Expo conference in Los Angeles, on July 5!

Mangaki Data Challenge Winners

(Cet article est aussi disponible en français.)

Palmarès du Mangaki Data Challenge

(This article is also available in English.)

Une nouvelle interface arrive sur Mangaki : mangaki/fix !

Présentation de la nouvelle interface

Mangakiデータチャレンジ日本語

(also in English / en français)

Mangaki Data Challenge, version française

(also in English / 日本語)

Mangaki Data Challenge, English version

(en français / 日本語)

Pourquoi vous devriez essayer la nouvelle version de Mangaki !

1. Nouveau design des cartes

Mangaki Data Challenge avec Kyoto U !

Mangaki organise cet été un data challenge en partenariat avec le Kashima lab à l’université de Kyoto !

Data challenge organized with Kashima's Lab, Kyoto University

Mangaki va organiser un data challenge avec le labo de machine learning du professeur Kashima à l’université de Kyoto.

Mangaki will be at the Anime & Manga Symposium @ Anime Expo, Los Angeles!

Le 2 juillet, nous étions à Anime Expo, Los Angeles ! Voir les slides.

Test our algorithms on Movielens!

You can run our 5-fold cross validation on the Movielens dataset.

In-flight entertainment systems

Je m’intéresse aux in-flight entertainment systems.

Systèmes de recommandation

Vous connaissez le principe, un utilisateur s’inscrit, rentre ses préférences, le système lui recommande des œuvres susceptibles de lui plaire.

Les œuvres à Mangaki

Particularités de mangaki.fr

  • Les notes : j’adore / j’aime / neutre / je n’aime pas / je veux voir / je ne veux pas voir
  • On peut vous recommander des mangas même si vous n’avez noté que des séries animées

Plus proches voisins (KNN)

Principe. Trouver des utilisateurs qui vous ressemblent en matière de goûts pour vous recommander ce qu’ils ont aimé que vous n’avez pas vu.

  • Quelles valeurs assigner à chaque rating (favorite, like, willsee, etc.) ?
  • Combien de voisins choisir ? Pour estimer la valeur d’une œuvre, faut-il considérer les 15 plus proches voisins ayant noté cette œuvre ? C’est ce que @Karypis20081 conseille.

Voir le code de la KNN sur GitHub

SVD

Principe. Trouver des profils types et répartir les utilisateurs selon cette base de profils types.

  • Comment considérer les entrées manquantes ? On les replace par la moyenne.
  • Avantage : on peut construire le Top 8000 d’un individu.

Voir le code de la SVD sur GitHub, depuis scikit-learn

De l’intérêt de la fonction d’erreur

  • Quelle fonction d’erreur choisir ? La RMSE ou simplement compter le nombre de faux positifs et négatifs ? Dans @Karypis20081, ils suggèrent plutôt une sorte d’Expected Utility qui pénalise plus les faux positifs que les faux négatifs.
  1. @Karypis2008 Information Gain through Clustered Neighbors, dans Learning preferences of new users in recommender systems: an information theoretic approach, ACM SIGKDD 2008.  2

Démarrage à froid

C’est bien beau d’avoir un moteur de recommandation mais encore faut-il l’alimenter (le bootstrapper) avec un test de bienvenue : un nouvel utilisateur ne sait pas quoi noter.