mauflix/source/main/models.py

478 lines
16 KiB
Python

import random
import time
import re
import wikipediaapi
from bs4 import BeautifulSoup
from django.conf import settings
from django.db import models
from pathlib import Path
from unidecode import unidecode
class Gender(models.Model):
id = models.AutoField(primary_key=True)
name = models.CharField(max_length=250)
class Meta:
unique_together = ["name"]
ordering = ["name"]
verbose_name = "Género"
verbose_name_plural = "Generos"
def __str__(self):
return self.name
class Country(models.Model):
id = models.AutoField(primary_key=True)
name = models.CharField(max_length=250, verbose_name="País")
class Meta:
unique_together = ["name"]
ordering = ["name"]
verbose_name = "País"
verbose_name_plural = "Paises"
def __str__(self):
return self.name
class PersonQuerySet(models.QuerySet):
def directors(self):
rows = self.filter(is_director=True).values_list("name", flat=True)
return rows
def actors(self):
rows = self.filter(is_actor=True).values_list("name", flat=True)
return rows
class Person(models.Model):
id = models.AutoField(primary_key=True)
name = models.CharField("Nombre", max_length=500)
country = models.ForeignKey(
Country, related_name="country", on_delete=models.PROTECT
)
date_born = models.DateField("Fecha de nacimiento", null=True, blank=True)
is_actor = models.BooleanField("Es Actor", default=False)
is_director = models.BooleanField("Es Director", default=False)
is_woman = models.BooleanField("Es mujer", default=False)
photo = models.ImageField(
"Fotografía", upload_to="%Y/%m/%d/", null=True, blank=True
)
objects = PersonQuerySet.as_manager()
class Meta:
unique_together = ["name"]
ordering = ["name"]
verbose_name = "Persona"
verbose_name_plural = "Personas"
def __str__(self):
return self.name
class MovieQuerySet(models.QuerySet):
def random_pick(self, random_max=6, min_items=20, all=None, **kwargs):
"""
Regresa películas de manera aleatoria.
Por defecto tiene que haber al menos 20 películas en la consulta.
Por defecto regresa un máximo de 6 películas.
"""
if all is None:
all = list(Movie.objects.filter(**kwargs).values())
if len(all) < min_items:
return None
elif len(all) < random_max:
return all
else:
return random.sample(all, random_max)
def top_pick(self, key, top_max=6):
"""
Regresa el top de películas.
El top corresponde al criterio de búsqueda en 'key'.
Por defecto regresa las primeras 6 películas como máximo.
"""
all = list(Movie.objects.order_by(f"-{key}").values())
return self.fix_all(all[:top_max])
def top_random_pick(self, key, top_max=6):
"""
Regresa el top de películas de manera aleatorias.
El top corresponde al criterio de búsqueda en 'key'.
Por defecto regresa un máximo de 6 películas.
A diferencia de 'random_pick', de todo el top selecciona de manera
aleatoria según el 'top_max'.
"""
all = list(Movie.objects.order_by(f"-{key}").values())
top = []
for movie in all:
if movie[key] == all[0][key]:
top.append(movie)
else:
break
if len(top) > top_max:
movies = random.sample(top, top_max)
else:
movies = top
return self.fix_all(movies)
def home_pick(self):
"""
Regresa la selección de películas para el 'home'.
El 'home' es la página principal.
"""
genders = list(Gender.objects.values_list("id", flat=True))
sections = self.home_sections()
for gender in genders:
key = Gender.objects.get(pk=gender).name
picked = self.random_pick(genders=gender)
if picked:
sections["genders"][key] = self.fix_all(picked)
return sections
def home_sections(self):
"""
Regresa la selección de películas en secciones para el 'home'.
Las secciones son novedades, mejor valorados y más descargados.
"""
sections = {
"Novedades": self.top_pick("id"),
"Mejor valorados": self.top_random_pick("stars"),
"Más descargados": self.top_pick("count"),
}
sections["genders"] = {}
return sections
def fix_all(self, movies):
"""
Enmienda los datos de las películas.
"""
for movie in movies:
self.fix_data(movie, wikipedia=False)
return movies
def fix_data(self, movie, wikipedia=True):
"""
Enmienda los datos de una película.
Los enmiendos son formateos de unos valores (que se guardan en nuevas
llaves) y de rutas a medios.
"""
if len(movie["file_name"]) == 0 or len(movie["cartel"]) == 0:
print(f"WARN: película sin ruta de video o cartel:\n{movie}")
movie["duration_formatted"] = self.format_duration(movie["duration"])
movie["count_formatted"] = self.format_count(movie["count"])
movie["stars_icons"] = self.format_stars(movie["stars"])
movie["file_name"] = self.fix_path(movie["file_name"])
movie["cartel"] = self.fix_path(movie["cartel"])
if wikipedia:
movie["wiki"] = self.get_wiki(movie)
def fix_path(self, el):
"""
Enmienda ruta a medio.
La ruta es distinta según se esté en producción o en desarrollo
('DEBUG'). La URL_DEBUB apunta a la dirección en nebula.
"""
if settings.DEBUG:
if str(Path(el).parent) == "." and len(el) > 0:
el = f"{el[0]}/{el}"
return settings.URL_DEBUG.format(el)
else:
return settings.MEDIA_ROOT / el
def fix_summ(self, raw):
"""
Enmienda sinopsis de Wikipedia.
Los sumarios de artículos a la Wikipedia vienen con notas al pie que no
son necesarias. Para la sinopsis estas notas son eliminadas y se
regresa el código HTML como una cadena de caracteres.
"""
html = BeautifulSoup(raw, "lxml")
for ref in html.find_all("sup", "reference"):
ref.decompose()
clean = list(map(lambda x: str(x), html.body.children))
return " ".join(clean)
def format_stars(self, num):
"""
Da formato a la cantidad de estrellas.
Regresa la cantidad de estrellas en lugar del número de estas.
"""
stars = "" * num
while len(stars) < 5:
stars += ""
return stars
def format_count(self, num):
"""
Da formato a la cantidad de descargas.
Regresa la cantidad en una cifra separada por comas.
"""
return "{:,}".format(num)
def format_duration(self, num):
"""
Da formato a duración.
Regresa la duración en 'Nh Nm'; p. ej.: 1h 22m, 2h, 15m.
"""
secs = num * 60
hours = self.format_duration_num("%H", secs)
mins = self.format_duration_num("%M", secs)
if hours == "":
return mins
elif mins == "":
return hours
else:
return f"{hours}&nbsp;{mins}"
def format_duration_num(self, num_type, secs):
"""
Da formato a cada número de la duración.
Extrae hora o minuto de la duración, la pasa a int y si no es cero,
regresa Ns; p. ej.: 1h, 55m.
"""
num = int(time.strftime(num_type, time.gmtime(secs)))
sym = num_type[-1].lower()
if num == 0:
return ""
else:
return f"{num}{sym}"
def get_wiki(self, movie, again=True):
"""
Obtiene artículo de Wikipedia.
Primero intenta obtener el artículo por el nombre original. Si no tiene
éxito, intenta obtenerlo por el nombre en español. Regresa None si no
tuvo ningún éxito.
"""
wiki = self.get_wiki_page(movie["original_name"])
if not wiki:
wiki = self.get_wiki_page(movie["name"])
return wiki
def get_wiki_page(self, title):
"""
Intenta obtener artículo de Wikipedia.
Si no tiene éxito, regresa 'None'.
"""
try:
lang = settings.LANGUAGE_CODE.split("-")[0]
wiki = wikipediaapi.Wikipedia(
lang, extract_format=wikipediaapi.ExtractFormat.HTML
)
page = wiki.page(title)
if page.exists():
return {
"title": page.title,
"url": page.fullurl,
"summary": self.fix_summ(page.summary),
}
else:
return None
except Exception:
return None
def get_related(self):
"""
Regresa los campos relacionados a las películas.
"""
return ["countries", "genders", "directors", "actors"]
def get_movie_by_id(self, id):
"""
Obtiene película por id.
Esta obtención también añade objetos relacionados.
"""
related = self.get_related()
movie = Movie.objects.prefetch_related(*related).get(pk=id).__dict__
for key, val in movie["_prefetched_objects_cache"].items():
movie[key] = list(map(lambda x: x["name"], val.values()))
movie.pop("_state")
movie.pop("_prefetched_objects_cache")
self.fix_data(movie)
return movie
def get_movies(self, query):
"""
Obtiene películas buscadas.
"""
movies = Movie.objects.prefetch_related(*self.get_related())
for q in self.get_queries(query):
selector = None
if re.match(r"^\w:", q) is not None:
selector = self.get_selector(re.sub(r"^(\w):.*", r"\1", q))
q = re.sub(r"^\w:(.*)", r"\1", q)
movies = self.get_movies_by_query(selector, q, movies)
if len(movies) != len(Movie.objects.all()):
if hasattr(movies, "values"):
movies = self.fix_all(list(movies.values()))
movies = self.random_pick(random_max=100, min_items=0, all=movies)
return movies
else:
return []
def get_movies_by_query(self, selector, query, movies):
"""
Obtiene película por query.
"""
if selector is None:
return self.get_movies_by_query_any(query, movies)
elif selector != "section":
return self.get_movies_by_query_selector(selector, query, movies)
else:
return self.get_movies_by_query_section(query, movies)
def get_movies_by_query_selector(self, selector, query, movies):
"""
Obtiene película por query que tiene selector 'w:'.
"""
if selector == "year":
selector = f"{selector}__iregex"
try:
query = int(query)
except Exception:
query = 0
else:
if selector == "name" or selector == "original_name":
selector = f"{selector}__unaccent__iregex"
else:
selector = f"{selector}__name__unaccent__iregex"
query = f"[[:<:]]{query}"
kwargs = {selector: query}
return movies.filter(**kwargs)
def get_movies_by_query_section(self, query, movies):
"""
Obtiene película por query que tiene selector 'w:' para sección.
"""
if query == "mejor valorados":
return self.top_random_pick("stars", top_max=100)
elif query == "novedades":
return self.top_pick("id", top_max=100)
elif query == "mas descargados":
return self.top_pick("count", top_max=100)
else:
return list(movies.values())
def get_movies_by_query_any(self, query, movies):
"""
Obtiene película por query que no tiene ningún selector.
"""
for field in ["name"] + self.get_related():
if field != "name":
field = f"{field}__name"
kwargs = {f"{field}__unaccent__iregex": f"[[:<:]]{query}"}
result = movies.filter(**kwargs)
if len(result) > 0:
movies = result
return movies
def get_queries(self, query):
"""
Devuelve un conjunto de queries sanitizado; p. ej.:
de: d:Bruno--Stagñaro y:1997 pizzá, birra, faso
a: ['d:bruno-stagnaro', 'y:1997', 'pizza', 'birra', 'faso']
"""
queries = re.sub(r"\s+", " ", unidecode(str(query)).lower()).split()
return list(map(lambda q: self.clean_query(q), queries))
def clean_query(self, word):
"""
Limpia query de caracteres 'W' al inicio y al final. También sustituye
'-' por un espacio.
"""
word = re.sub(r"^\W+", "", word)
word = re.sub(r"\W+$", "", word)
word = re.sub(r"-+", " ", word)
return word
def get_selector(self, prefix):
"""
Obtiene el selector para filtrar la consulta de una búsqueda.
Esto permite restricciones en la búsqueda con esta sintaxis:
* t:Un-Título => Buscará las películas que tengan 'Un T…' en sus 'name'
* d:Nombre => Buscará las películas que tengan 'N…' en sus 'directors'
El guion (-) se usa como separador de palabras, puede contener acentos
o eñe, aunque va a ser decodificado.
"""
prefixes = {
"t": "name",
"o": "original_name",
"y": "year",
"c": "countries",
"p": "countries",
"d": "directors",
"a": "actors",
"g": "genders",
"s": "section",
}
if prefix in prefixes:
return prefixes[prefix]
else:
return None
def upload_cartel(instance, filename):
first = filename[0].upper()
if first.isdigit():
first = "0"
return f"{first}/{filename}"
class Movie(models.Model):
id = models.AutoField(primary_key=True)
name = models.CharField("Nombre", max_length=1000)
original_name = models.CharField(
"Nombre original", max_length=1000, default="", blank=True
)
file_name = models.CharField(
"Nombre archivo", max_length=1000, default="", blank=True
)
year = models.PositiveSmallIntegerField("Año", default=1900)
duration = models.PositiveSmallIntegerField("Duración", default=0)
directors = models.ManyToManyField(
Person, verbose_name="Director", related_name="directors"
)
actors = models.ManyToManyField(Person, related_name="actors", blank=True)
countries = models.ManyToManyField(
Country, related_name="countries", verbose_name="País", blank=True
)
genders = models.ManyToManyField(
Gender, related_name="genders", verbose_name="Género", blank=True
)
cartel = models.ImageField(
"Cartel", upload_to=upload_cartel, null=True, blank=True
)
count = models.PositiveIntegerField("Descargas", default=0)
stars = models.PositiveSmallIntegerField("Estrellas", default=0)
published = models.BooleanField("¿Publicar?", default=True)
is_digital = models.BooleanField("Es digital", default=False)
objects = MovieQuerySet.as_manager()
class Meta:
unique_together = ["name", "original_name"]
ordering = ["name"]
verbose_name = "Película"
verbose_name_plural = "Películas"
def __str__(self):
return self.name