PyrVision és un model d’Intel·ligència Artificial desenvolupat al Centre de Ciència i Tecnologia Forestal de Catalunya amb la col·laboració del Centre de Visió per Computador, amb la capacitat de detectar automàticament fins a 16 classes diferents. PyrVision utilitza YOLOv9, l’estat de l’art dels models de detecció d’objectes, per tal de maximitzar precisió i rapidesa.

El problema

L’avaluació i seguiment de les poblacions d’animals salvatges és un requeriment per un bon coneixement de les espècies presents al nostre territori. Aquest coneixement és el que permet, gràcies a les estimacions que se’n deriven, planificar-ne la seva gestió, conservació i protecció. Aquestes estimacions sovint provenen d’albiraments puntuals d’individus mitjançant sensors automàtics així com aquells realitzats per tècnics sobre el terreny. La naturalesa críptica i esquerpa d’alguns animals fa que sigui pràcticament impossible veure’ls a simple vista per tècnics sobre el terreny. Una manera per detectar aquests individus i estimar-ne la seva població és gràcies a les càmeres de fototrampeig. Aquests sensors són col·locats en el seu hàbitat i enregistren imatges i/o vídeos al detectar un individu mitjançant sensors de moviment.

Una sola càmera de fototrampeig pot enregistrar entre 2.000 i 10.000 imatges en un període de tres mesos. Aquestes imatges són recollides i revisades pels tècnics, una per una, per tal d’analitzar-les i classificar-les. Depenent del volum i qualitat (les imatges captades de nit per infraroig són més difícils de classificar) aquesta tasca aparentment senzilla i repetitiva pot durar dies i fins i tot setmanes.

La tecnologia

La intel·ligència artificial és un camp multidisciplinari que engloba ciència i enginyeria i que té per objectiu el desenvolupament d’algorismes capaços d’interpretar dades externes, aprendre d’aquestes, i fer servir els coneixements adquirits per completar tasques i assolir objectius específics mitjançant una adaptació flexible. Durant l’última dècada, el camp de l’aprenentatge profund i la intel·ligència artificial ha experimentat un creixement espectacular. Aquest creixement es deu, principalment, a dos factors. En primer lloc, la creixent capacitat de generar i emmagatzemar gran quantitat de dades, gràcies a tecnologies com “el núvol” o l’ “internet de les coses” (IoT). En segon lloc, l’avenç i millora del maquinari així com noves capacitats de distribució de càlcul en paral·lel s’han traduït en un gran augment de la capacitat de processament que, a més, pot ser avui dia contractada pel públic general.

Una de les aplicacions més característiques de l’aprenentatge profund, o deep learning per les seves sigles en anglès, és la visió per computador. Aquest camp interdisciplinari estudia com els ordinadors són capaços d’entendre imatges o vídeos i generar informació rellevant com la identificació d’objectes o la classificació automàtica d’imatges i sons.

L’oportunitat

En els darrers anys, la intel·ligència artificial, i en concret el camp de visió per computador, han fet un salt espectacular. El desenvolupament de nous algorismes així com la creixent capacitat de càlcul suposen avui dia una nova frontera en la nostra capacitat per processar imatges en temps real. La tecnologia de visió per computador ja és aplicada a dia d’avui, majoritàriament amb èxit, en diversos camps com la medicina o la conducció autònoma de vehicles.

Els sistemes de visió per computació i classificació d’imatges poden assolir un nivell de precisió semblant al d’un humà i, en alguns casos, fins i tot millor. A més, el procés de detecció és capaç de realitzar aquesta classificació en fraccions de segon, el que es tradueix en desenes d’imatges classificades a cada segon.

Arquitectura del Model

PyrVision són, en realitat, dos models unificats; un per imatges en blanc i negre, i un altre per imatges en color.

Els mamífers del Pirineu tenen diferents hàbits . Algunes són més nocturnes, altres més diurnes i d’altres apareixen tant de dia com de nit. Degut a que els models d’Intel·ligència Artificial requereixen de grans quantitats d’imatges per aprendre a detectar una espècie en concret, algunes només són reconeixibles en imatges de nit i d’altres només en imatges de dia. Podeu trobar la llista d’aquestes espècies a continuació, en funció de si són reconegudes pel model de color [C] i/o del blanc i negre [BN].

Espècies

PyrVision pot detectar les següents espècies de mamífers salvatges:

  • Cabirol – Capreolus capreolus [C][BN]
  • Gat fer – Felis silvestris [C][BN]
  • Llebre – Lepus europaeus [C][BN]
  • Isard – Rupicapra pyrenaica [C][BN]
  • Porc senglar – Sus scrofa [C][BN]
  • Guineu – Vulpes vulpes [C][BN]
  • Cérvol – Cervus elaphus [C][BN]
  • Esquirol – Sciurus vulgaris [C]
  • Ós bru – Ursus arctos [C][BN]
  • Daina – Dama dama [C][BN]
  • Llop – Canis Lupus [C][BN]
  • Marta – Martes sp. [BN]
  • Teixó – Meles meles [BN]

Altres classes:

  • Vaca – Bos taurus [C][BN]
  • Cavall – Equus caballus [C]
  • Gos – Canis familiaris [C]
  • Humà – Homo sapiens [C]
  • Vehicle [C]

Exemples

Utilització

PyrVision estarà disponible en el següent enllaç:

https://github.com/ArnauCampanera/PyrVision


Activitat finançada a través de l’Operació 01.02.01 de Transferència Tecnològica del Programa de desenvolupament rural de Catalunya 2014-2022