Landeswettbewerb »Jugend forscht 2026
Von der synthetischen Erzeugung von Handschriftproben für die Digitalisierung bis hin zur Entwicklung einer intelligenten Halterung für Asthma-Inhalatoren mit Erinnerungsfunktion – auch dieses Jahr haben sächsische Schüler mit ihren innovativen Ideen und Problemlösungen überzeugt.
Martin Lütke-Entrup, Elftklässler am Sächsischen Landesgymnasium Sankt Afra zu Meißen, war mit seinem Projekt »Synthetische OCR-Trainingsdaten als kostengünstige Alternative zu Hand-Labeling« im diesjährigen Landeswettbewerb »Jugend forscht« erfolgreich. Der 16-Jährige erforschte in seinem Vorhaben, wie die Wirtschaftlichkeit von Systemen zur automatischen Texterkennung (OCR-Systeme) in Unternehmen und Verwaltung durch die Nutzung synthetisch erstellter Trainingsdaten verbessert werden kann. Der Wettbewerb wurde am 28. März 2026 in Chemnitz ausgetragen.
Systeme zur optischen Zeichenerkennung (Optical Character Recognition - OCR) spielen eine Schlüsselrolle bei der Digitalisierung händisch befüllter Formulare oder handschriftlich verfasster Dokumente. OCR ist eine Technologie, die gescannte Papierdokumente, PDFs oder Bilder in bearbeitbaren, durchsuchbaren Text umwandelt. Konventionelle Trainingsdaten zum Anlernen dieser Systeme sind jedoch aufgrund des für die Erstellung nötigen Zeitaufwands kostenintensiv, insbesondere wegen händischer Arbeiten, die bei synthetisch erzeugten Daten entfallen.
In seinem erfolgreichen Durchgang erstellte Martin Lütke-Entrup die Trainingsdaten aus verschiedenen lizenzfreien Handschrift-Fonts. Um die Bandbreite zu erhöhen, wurden die hieraus gewonnenen Rohdaten durch Rotation, Skalierung, Verzerrung, Gaußsches Rauschen und Unschärfe variiert. In seinem Projekt zeigt er, dass synthetisch generierte Trainingsdaten eine kostengünstige und skalierbare Alternative zu manuell gewonnenen Schriftzeichendatensätzen für OCR-Systeme darstellen, mit denen Handschrift in digitalen Formularen automatisiert und mit vergleichbarer Genauigkeit erfasst werden kann. Mit synthetischen Trainingsdaten können die Kosten für OCR-Training deutlich gesenkt werden. Hiermit kann die Digitalisierung von Papierprozessen in Verwaltung, Gesundheitswesen und Unternehmen, wo handschriftliche Daten noch immer manuell erfasst werden, maßgeblich beschleunigt werden.
Von den insgesamt 30 eingereichten Wettbewerbsbeiträgen – darunter acht in der Sparte »Jugend forscht junior« – überzeugten die beiden ausgezeichneten Arbeiten nach dem Urteil der Jury nicht nur durch ihren wissenschaftlichen Anspruch, sondern auch durch ihren starken Praxisbezug. Deshalb erhalten sie die diesjährigen Sonderpreise des Sächsischen Staatsministeriums für Wirtschaft, Arbeit, Energie und Klimaschutz im Wettbewerb »Jugend forscht« und »Jugend forscht junior«.