Scripts rutinarios para actualización de campos #9

Open
opened 2023-02-13 12:25:00 -06:00 by perro · 2 comments
Collaborator

Esto es pa discutir cuando nos veamos, @elmau. La idea es la siguiente:

En las pelis que exista un campo para el texto de la Wikipedia. Así, con las apis de Wikipedia y de Wikidata podemos tener un script que se ejecute cada cierto tiempo (por semana, quincena o mes) para que actualice la información del texto de la Wiki, los géneros de las películas y más (por ejemplo, esta es la wikidata de A nuestros amores).

Las ventajas que veo para esto son:

  • Divertirme usando ambas apis xD
  • Disminuye la carga de cada peli porque actualmente cuando se da clic a la ficha de una peli se hace un query a Wikipedia para obtener la información, en lugar de que esté guardada en la misma DB.
  • Permitiría dar más información en el home; por ejemplo, al hacer hover sobre la ficha muestra el título de la peli, ahí podría incorporarse también su descripción.
  • Podría incluirse más información como la calificación de imdb o de los tomates.
  • Mata dos pájaros de un tiro porque curar la información para mauflix implicaría curar la información en Wikidata/Wikipedia.

Las desventajas que veo son:

  • Es desarrollo adicional
  • Puede ser delicado modificar de manera automatizada las entradas de las fichas; aunque puede mitigarse si el script previamente hace un respaldo.
  • Sí o sí se van a necesitar «diccionarios» para enmendar datos; por ejemplo, el género de A nuestros amores es «drama film»; si se ve el wikidato de ese género tiene traducción a «cine de drama», pero puede ser que no nos agrade; entonces, se requiere un diccionario para que el valor «drama film» se guarde como «drama» en mauflix; el lado positivo es que es un proceso que ya he hecho al momento de categorizar libros, así que el tema es que pues de todas manera hay talacha en la automatización de campos que es precisamente la generaci
Esto es pa discutir cuando nos veamos, @elmau. La idea es la siguiente: En las pelis que exista un campo para el texto de la Wikipedia. Así, con las apis de [Wikipedia](https://github.com/martin-majlis/Wikipedia-API) y de [Wikidata](https://github.com/dahlia/wikidata) podemos tener un script que se ejecute cada cierto tiempo (por semana, quincena o mes) para que actualice la información del texto de la Wiki, los géneros de las películas y más (por ejemplo, esta es [la wikidata de *A nuestros amores*](https://www.wikidata.org/wiki/Q2301425)). Las ventajas que veo para esto son: * Divertirme usando ambas apis xD * Disminuye la carga de cada peli porque actualmente cuando se da clic a la ficha de una peli se hace un query a Wikipedia para obtener la información, en lugar de que esté guardada en la misma DB. * Permitiría dar más información en el home; por ejemplo, al hacer hover sobre la ficha muestra el título de la peli, ahí podría incorporarse también su descripción. * Podría incluirse más información como la calificación de imdb o de los tomates. * Mata dos pájaros de un tiro porque curar la información para mauflix implicaría curar la información en Wikidata/Wikipedia. Las desventajas que veo son: * Es desarrollo adicional * Puede ser delicado modificar de manera automatizada las entradas de las fichas; aunque puede mitigarse si el script previamente hace un respaldo. * Sí o sí se van a necesitar «diccionarios» para enmendar datos; por ejemplo, el género de *A nuestros amores* es «*drama film*»; si se ve [el wikidato de ese género](https://www.wikidata.org/wiki/Q130232) tiene traducción a «cine de drama», pero puede ser que no nos agrade; entonces, se requiere un diccionario para que el valor «drama film» se guarde como «drama» en mauflix; el lado positivo es que es un proceso que ya he hecho al momento de categorizar libros, así que el tema es que pues de todas manera hay talacha en la automatización de campos que es precisamente la generaci
Author
Collaborator

Como que hay un límite de caracteres, el post pasado termina con:

de todas manera hay talacha en la automatización de campos que es precisamente la generación y el mantenimiento de diccionarios.

Como que hay un límite de caracteres, el post pasado termina con: > de todas manera hay talacha en la automatización de campos que es precisamente la generación y el mantenimiento de diccionarios.
Author
Collaborator

Olvidé añadir a la propuesta la adición de un campo en cada peli para su ID en Wikidata (e incluso para su enlace al artículo de Wikipedia).

Por ejemplo, la peli A nuestros amores tiene como ID de wikidata Q2301425.

Esto puede permitir los errores en el raspado de la información como se menciona en #7.

Olvidé añadir a la propuesta la adición de un campo en cada peli para su ID en Wikidata (e incluso para su enlace al artículo de Wikipedia). Por ejemplo, la peli *A nuestros amores* tiene como ID de wikidata `Q2301425`. Esto puede permitir los errores en el raspado de la información como se menciona en #7.
Sign in to join this conversation.
No Label
No Milestone
No Assignees
1 Participants
Notifications
Due Date
The due date is invalid or out of range. Please use the format 'yyyy-mm-dd'.

No due date set.

Dependencies

No dependencies set.

Reference: elmau/mauflix#9
No description provided.