Bug du nouveau Metadate TheMovieDB


Freebase n'est pas une merde. C'est surment le metadata agent avec le plus grand potentiel. Son point faible le contenu francophone. Pour le moment il n'y a que des infos récupérées sur Wikipédia dans la base. Mais bon c'est un autre de mes projets à long terme. On en reparle.

Ce qui pourrait être bien c'est d'utiliser une option du metadata agent de TheTVDB pour prendre ou non les ratings, et laisser un autre plugin le faire.



Peut-être que tu as raison mais pour le moment cela n'apporte rien de bon chez moi.

D'une part je le soupçonne de m'empêcher d'accéder à certains films sur TMDB alors que je les ai renommé à de nombreuses reprises pour les faire correspondre à la fiche TMDB.

De plus, il me rajoute des taglines "None" ou des textes en anglais alors que je n'en veux pas.

Bref, c'est peut-être l'avenir mais pour le moment je rêve que d'une chose c'est de pouvoir le désactiver et malheureusement c'est pas possible.

Pour info, voici la liste des films dont je n'arrive pas à accéder à la fiche sur tmdb :

Mission Impossible III
Leaving Las Vegas
Les liens du sang
Tangled
The Last Minute

Pour ton problème, par exemple, mission impossible 3, c’est le même problème que moi, un doublon dans la baSe. Automatiquement, le metadata ce plante et prend la mauvaise fiche, peut être la plus récente, je sais pas… Prof seul moyen, renseigne ce doublons sur le forum de themoviedb… Je viens de poster pour mission impossible et ensuite, normalement, il suprime la mauvaise fiche.

Tu peux voir le numéro de la fiche pris par le meta dans la console…

Il y a encore des bugs mais c’est quand même une bonne solution de meta…

Moi aussi j’ai les tagline none, je sais pas d’où ça viens, si c’est moviedb ou freebase ou bug de la dernière version du PMS qui fait qu’il met none quand il n’y a pas de tagline… A creuse dc…



Merci pour le tuyau, je vais regarder ça de plus près.





Ca peut que venir de freebase parce que j'ai uniquement tmdb et freebase de coché. Et si je regarde par exemple Léon sur tmdb, il y a un tagline très court en anglais et rien en français. Malgré cela je me retrouve avec une tartine !

Une solution facilement implémentable serait d'avoir une préférence pour l'agent freebase qui permettrait de ne reprendre aucune donnée de cette base. On garderait donc uniquement l'algorithme freebase servant à la recherche du numéro imdb mais sans pomper de données. Peu d'espoir que cela arrive.

L'autre solution sur laquelle je mise beaucoup c'est que le metadata agent TMDB Standalone de Raindancing soit :

- internationalisé (1ère priorité)
- qu'il ait des préférences pour ne pas reprendre certaines infos (taglines et ratings, points faibles de TMDB pour les francophones)
- éventuellement qu'il inclue un algorithme pour la recherche des films par noms dans la base TMDB (bien que je suis prêt à renommer tous mes films qui ne seraient pas repris du premier coup)

Aqntbghb, as-tu un commentaire à faire ??? ;-)

Le meilleur moteur de recherche c’est Google. C’est comme cela que fonctionne freebase et c’est ainsi que je l’avais codé pour CinéPassion. Par exemple pour CinéPassion je cherche le nom du film dans google de plusieurs façon (par exemple en focant les recherche sur le site allociné). Je peux donc récupérer dans les résultats google l’ID allociné (utilisé par Cinépassion). Ensuit on évalue chaque résultat pour les classer et garder celui qui semble le plus convenir.

Je pense qu’il faudrait faire pareille avec TMDB. J’ai pas encore eut le temps de regarder le code.

Très intéressant de savoir comment fonctionne l’algorithme.



As-tu un intérêt à contribuer à cet agent ? Ce serait une excellente nouvelle étant donné les possibilités et la facilité d’utilisation de la base TMDB.

Le TMDB tel qu’il existe actuellement utilise l’ID IMDB pour faire la recherche (regardez le code de la fonction search ca ne fait que matcher l’id IMDB à un id TMDB).



Si on veut passer sur un TMDB-Standalone, il va falloir coder une recherche à-la-oncleben31, sachant que la recherche de TMDB est bugguée quand on l’utilise avec un caractère non-ascii (hé oui ca aurait été trop simple). donc en fait il y a peu à gagner pour l’instant par rapport à la solution actuelle. mais je peux me tromper sur l’analyse de la situation :slight_smile:



Pour ce qui est des taglines avec None, j’ai un patch sur Git qui permet de corriger ça. par contre ca rajoutera pas de tagline de bonne qualité en francais dans la base TMDB. En fait il faudrait une évolution du framework de Plex pour choisir quelélément on veut prendre de quel agent (mais là ca devient une vraie usine à gaz) :wink:

Même avec le bug et sans un algorithme de recherche, le TMDB-Standalone permet d’identifier un film rapidement lorsque TMDB via Freebase échoue. Donc ça reste un atout important sauf qu’il ne renvoie que les infos de TMDB en anglais…



Concernant la personalisation des résultats via plusieurs agents, il n’y a pas besoin d’un nouveau framework à mon avis. Il peut y avoir qu’un seul agent qui regroupe des parties de code des autres et permettre ainsi de récupérer les éléments au choix de l’utilisateur sur différentes bases tel Freebase, TMDB, IMDBAPI, Cinépassion et d’autres. Bref l’agent ultime.



En fait, je me dis même que ça doit pas être si compliqué que ça. D’abord il faut une recherche Google du type Freebase ou Cinépassion pour trouver le numero IMDB et après les requêtes se font sur les différentes bases de données selon les préférences de l’utilisateur.

Mitch969> ce que tu décrit c’est freebase en fait :wink:



Merci je vais creuser ça alors :)


Euh, non pas vraiment.

Ce que je décris c'est freebase sans la base de donnée freebase, c'est à dire un pure algorithme de recherche auquel on ajoute plusieurs bases de donnée mais surtout pas la base freebase !

C'est plus clair ?

Bon si c'est pas le cas je réexplique différemment :

Ce que je décris c'est cinépassion sans la base de donnée cinépassion, c'est à dire un pure algorithme de recherche auquel on ajoute plusieurs bases de donnée mais surtout pas la base freebase mais éventuellement la base cinépassion si vraiment y a pas le choix !

:)

Quel que soit ton algo de recherche, il faut qu’il aie un index (id ou clef tu l’appelles come tu veux), ca peut etre un id allocine ou un id imdb mais il faut un ID. C’est ce que fait freebase. va lire le code de freebase et tu vas voir que c’est la meilleure solution car elle s’améliore avec le temps grace aux hash des gens qui utilisent freebase. :slight_smile:

Comment tu fais pour savoir si un film est deux fois dans la base ?

Ok je vais voir cela.



Concernant TMDB Standalone, j’ai remplacé “en” par “fr” dans l’url de Movie.search et Movie-getInfo. Du coup je me retrouve bien avec les résumés en français par contre je sais pas comment faire pour avoir les titres en français (j’ai essayé metadata.title = GetText(‘name’) au lieu de metadata.title = media.title mais ça donne rien).



Une idée ?



init.py.zip (1.94 KB)



Visiblement il faut regarder les logs pour voir quel numéro TMDB est trouvé. Ensuite tu cherche ton film sur le site TMDB. Si le numéro est différent c'est qu'il est deux fois.

Est-ce que la commande Movie.imdblookup permet d’avoir tous les films qui ont l’Id imdb ? Ou retourne t’il un seul élément même s’il y en a plusieurs ?



Oui en faite dans la console, l'url de l'api indique le numero TMDB du film pris. Comme lorsque l'on recherche on trouve le film avec sa fiche en français (en général...), on peux aisément comparer les 2 numéro dans l'url et on remarque ainsi qu'il y a un doublon si celui-ci est le different...

Après réflexion, je ne comprend par pourquoi le metadata, lorsqu'il y a un doublon, ne sélectionne pas la seul fiche en français, en effet, il y a pratiquement aucune chance, pour que les doublons soit tout les deux français... mais aprés, je ne suis pas un expert en Python donc je ne peux que donner des directions de recherche alors...


Pas possible de savoir pour le moment parce que tous les doublons ont été corrigé : http://forums.themoviedb.org/post/10217/

En même temps, les doublons c'est très rare parce que lorsque tu entre un nouveau film sur tmdb, le site te sort des cas similaires et te demande de confirmer que c'est bien un film inexistant dans la base de donnée.

Donc à mon avis, tu devrais pas te soucier de ça.

Si c'est pas indiscret, tu travail sur quoi ???

mitch969> je viens de te faire une version internationalisée du plugins standalone (attaché ici et dans le sujet original). Je vois pas encore trop l’intéret mais bon si des gens veulent tester :slight_smile:

Merci beaucoup. Je vais testé demain.



Beaucoup d’intérêt pour les films non reconnus par Freebase donc on peut utiliser cet agent pour faire une recherche directement sur TMDB au lieu de passer 15 minutes à renommer le fichier qui passe mal, souvent sans succès d’ailleurs.



Pour ma part je pense même l’utiliser en principal si les tests sont convainquant.



Je vais ensuite essayer d’utiliser l’agent inofficiel IMDB pour recuperer les ratings. Pour le moment, j’arrive à rien parce que cet agent utilise le résultat Freebase et pas le numéro IMDB reçu par l’agent TMDB Standalone. D’ailleurs je ne suis pas certain que ce dernier récupère le numéro lors du scan.



Bref, je risque de te revenir avec quelques questions…



Merci encore.