Blog | hiqs GmbH

Artificial Intelligence - Capsule Networks

Artificial Intelligence Künstliche Intelligenz Neuronale Netze Computer Vision Convolutional Neural Networks Capsule Network

Motivation - oder auch: Warum machen wir das ganze?

Convolutional neural networks (ConvNets) sind zum Standardwerkzeug im Bereich von Computer Vision Aufgaben, wie Bildklassifizierung und Objekterkennung geworden. Trotz ihres Erfolges und ihrer guten Performance, gibt es auch ein paar Schwierigkeiten und Einschränkungen in ihrer Anwendung. Eine Einschränkung ist, dass ConvNets das Vorhandensein von Merkmalen erkennen, aber nicht die Beziehungen zueinander. Wird ein Merkmal an eine Stelle versetzt, an die es nicht gehört, führt dies trotzdem zur gleichen Klassifizierung, wie z.B. ein entstelltes Gesicht mit dem Mund auf der Stirn, dass immer noch als Gesicht eingeordnet wird. Ein um 180 Grad gedrehtes Gesicht jedoch könnte leicht missklassifiziert werden aufgrund fehlender Rotationsinvarianz. ConvNets sind auch anfällig für sog. ‚Adversarial Attacks‘, bei denen das Bild z.B. durch Überlagerung von Rauschen verändert wurde. Dem menschlichen Auge erscheint das Ergebnis identisch zum Ausgangsbild, wird aber vom neuronalen Netzwerk als etwas ganz anderes erkannt.

Capsule Network (CapsNet) sind eine neuronale Netzwerkarchitektur, die 2011 von Geoffrey Hinton et al vorgestellt wurde[1]. Nachdem 2017 ein erfolgreicher Trainingsalgorithmus entwickelt wurde [2], wuchs das allgemeine Interesse an dieser relativ neuen Vorgehensweise. Die grundlegende Idee besteht darin, dass Neuronen in Kapseln gruppiert werden und die Kapseln wiederum in Schichten. Der wesentliche Unterschied ergibt sich aus der Tatsache, dass Input und Output kein Skalar sind, wie bei einem einzelnen Neuron, sondern ein Vektor. Dadurch kann die Kapsel zusätzliche Information, wie Orientierung und Position kodieren. Somit besteht das Potenzial mit CapsNets bessere Ergebnisse zu erzielen oder ConvNets mit zusätzlichen Kapselschichten aufzuwerten.

Das Ziel dieser Thesis

Das Ziel dieser Thesis ist es die Funktionsweise von Capsule Networks zu untersuchen und ihre Performance bei Computer Vision Aufgaben zu beurteilen, insbesondere bezüglich räumlicher Transformation und ‚Adversarial Attacks‘.

Haben Sie Interesse an den Ergebnissen dieser Arbeit? Möchten Sie von unserem Know-How im Bereich Artificial Intelligence profitieren?

Sprechen Sie uns einfach direkt an!

[1] Hinton, G.E., Krizhevsky, A., Wang, S.D.: Transforming auto-encoders. In: International Conference on Artificial Neural Networks. pp. 44–51. Springer (2011) [2] Sabour, S., Frosst, N., Hinton, G.E.: Dynamic routing between capsules. In: Advances in Neural Information Processing Systems. pp. 3859–3869 (2017)

Sie haben offene Fragen?

Sie sind interessiert an weiteren Informationen und würden gerne mit uns sprechen? Schicken Sie uns gerne eine Nachricht und wir werden uns schnellstmöglich bei Ihnen melden.
hiqs GmbH