Afstudeeropdracht: realtime beeldherkenning voor geautomatiseerde camerasturing

Afstudeeropdracht: realtime beeldherkenning voor geautomatiseerde camerasturing

  • Afstuderen
  • Zwolle

Site MVI AudioVisual

Marktleider in de automatisering van AV systemen in raadzalen

Organisatie
MVI AudioVisual, gevestigd in Zwolle, is een internationaal opererend software-ontwikkelingsbedrijf. Wij richten ons op het ontwikkelen, ondersteunen en verkopen van eigen softwareoplossingen in de markt van conferentie-microfoonsystemen. Wij zijn actief in de wereld van parlementen, provincies, kantons en gemeenteraden en zijn wereldwijd marktleider in software voor conferentiesystemen.
Daarnaast ontwikkelen wij eigen audiovisuele software gericht op aansturing en ‘low-latency’ weergeven van camerabeelden, HDMI video, live H264/HEVC videostreams en gegenereerde content zoals stemresultaten, spreektijden en HD ‘character-generation’. Wij vervangen met onze software een groot gedeelte van hardware waar een 19” rack normaal redelijk gevuld mee is.

De casus
Ons product EasyCam is een software-gebaseerde video mixer. Het kent ook innovatieve algoritmes om beschikbare PTZ camera’s geautomatiseerd op de juiste positie te zetten. Dit wordt gebruikt om sprekers in een raadzaal, tijdens een vergadering, in beeld te brengen. Deze shots zijn vooraf vastgelegd en houden geen rekening met de lengte van de persoon waardoor het voorkomt dat mensen half in beeld komen. Ook gaan sprekers soms staan en/of staan de stoelen niet exact op de plek waar ze eerder stonden. Vaak moet er dan handmatig worden ingegrepen door iemand die de camera een tikje naar boven/onder/links/rechts geeft.

De opdracht
Vind het meest geschikte real-time beeldherkennings-framework om de beelden te analyseren en de PTZ camera bij te sturen waar nodig. Maak hiervan een proof-of-concept. Er zijn een aantal aspecten die de opdracht interessant maken:
– Real time analyse van de videobronnen is belangrijk om snelle schakelingen en soepele overgangen te kunnen halen. We kunnen gebruik maken van de mogelijkheden van Nvidia/CUDA.
– Hoe kunnen we onderscheid maken tussen de actieve spreker en personen in de achtergrond, ook als de spreker wegkijkt? Is identification bovenop recognition hiervoor mogelijk?
– Volledige automatisering is het doel, algoritmiek voor de verschillende scenario’s moet ontwikkeld worden.

Om te solliciteren op deze vacature stuur je je sollicitatie naar j.de.wilde@mvi-audiovisual.com

To top