Interview: Wie die Neural Engine djay Pro AI und andere Apps revolutioniert

Interview: Wie die Neural Engine djay Pro AI und andere Apps revolutioniert

Karim Morsy ist Gründer und CEO von Algoriddim aus München. Wie die international bekannte und preisgekrönte DJ-Software Gebrauch von AI macht, was die Neural Engine für Entwickler, Apps und Nutzer bedeutet, warum die M1 Macs von Apple so bedeutsam sind und wie es ist, wenn einen Tim Cook im Wohnzimmer besucht.

Karim, du hast anstrengende Wochen hinter dir. Aus Djay Pro für den Mac wurde Djay Pro AI. Mit dem neuen Neural Mix können Nutzer dank Künstlicher Intelligenz (Artificial Intelligence, AI) jetzt Musik in ihre Bestandteile aufsplitten. Und das in Echtzeit. Wie ist der Launch gelaufen?

Bisher lief es super. Wir freuen uns immer, nachdem wir so lange im stillen Kämmerlein gearbeitet haben, wenn wir dann endlich die Reaktionen der Nutzer sehen. Und es war ein überwältigend positives Feedback. Auch im Zuge der Veröffentlichung der ersten M1-Macs gab es tolle Rückmeldungen, wie schnell wir mit der Software schon dabei sind und da passt natürlich eine App wie Djay, die voll auf AI setzt, super rein.

Wir lesen ja viel über Performance, darüber wie der M1 Chip alles in den Schatten stellt. Was ist dein Eindruck von Apple ersten eigenen Prozessor – als Entwickler und als Nutzer? 

Sowohl als Entwickler als auch als Nutzer kann ich nur unterstreichen, dass das ein fundamentaler Durchbruch ist. Wenn man sich die Performance anschaut, ist die nicht wie bisher bei einem Generationenwechsel ein bisschen schneller, sondern es ist wirklich ein Quantensprung. Das merkt man als Nutzer bereits, ohne dass man mit der Stoppuhr daneben sitzt. Wenn man Programme startet oder sieht, wie snappy sich die Features anfühlen, ist das ein gewaltiger Unterschied. 

Wenn man sich die Performance anschaut, ist die nicht wie bisher bei einem Generationenwechsel ein bisschen schneller, sondern es ist wirklich ein Quantensprung.

Karim Morsy über den M1 Chip und die Neural Engine in den neuen Macs

Vom Mac zurück zu Djay und Algoriddim. Fangen wir mal ganz von vorne an: Deine ersten Erfahrungen – so las ich in einem Interview – entstanden beim Spielen mit dem Plattenspieler Deiner Eltern. Das war der Beginn der DJ-Karriere. Aber wie und wann kam der Gedanke: Das geht doch alles viel besser auf dem Computer?

Ich war als Kleinkind schon sehr musikaffin. Meine Eltern hatten ein Klavier, das keiner bespielt hat, und ich bin als Vierjähriger schon dahin und war fasziniert davon, dass es mechanisch Töne machte. Mit fünf oder sechs lernte ich das Klavierspielen und so ist meine Liebe zur Musik entstanden. Das hat sich weiterentwickelt und als Teenager habe ich den Plattenspieler im Wohnzimmer für mich entdeckt. Ich fand es faszinierend, dass man die Platte anfassen und scratchen konnte. Das war natürlich nicht sehr zur Freude meiner Eltern. (lacht) Aber ich fand die ganze User Experience spannend. So habe ich später mein erstes DJ Equipment gekauft und konnte scratchen, ohne dass das Vinyl kaputt geht. So ist es entstanden, dass ich das bis Anfang 20 tagtäglich als Leidenschaft gemacht habe. Aber es gab von Anfang an diesen Impuls, wenn zum Beispiel Freunde zu mir kamen, dass das doch irgendwie jeden fasziniert, aber die Hürden viel zu hoch sind, das selbst zu machen. Es war eine kleine Nische, das Equipment war sehr teuer und aufwändig zusammen zu stöpseln. Jeder hatte zuhause mal eine kleine Party, wo in irgendeiner Weise Musik abgespielt werden muss. Jeder wollte das also gerne. Und so entstand allmählich die Vision: Kann man das nicht der gesamten Menschheit zugänglich machen?

Karim Morsy ist CEO und Gründer von Algoriddim. Foto: privat
Karim Morsy ist CEO und Gründer von Algoriddim. Foto: privat

Und dann: Gesagt, getan?

Ich habe dann Informatik und Musik studiert und habe im Studium Kommilitonen kennen gelernt, die auch dieses Interesse, aber keine große musikalische Erfahrung hatten. Wir haben uns dann gemeinsam auf den Weg gemacht. Abgesehen von dem Equipment ist es ja auch viel Übung und jahrelange Erfahrung, bis man vernünftig auflegen kann. Und so ist die Idee entstanden: Bauen wir doch eine Software, die ich genauso als Professioneller etwa im Club einsetzen kann, die aber andererseits auch einen kompletten Einsteiger zum DJ macht.

Wir waren nicht die typischen Techies, die schon mit 12 Jahren angefangen haben, zu programmieren.

Karim Morsy

Hinter Euch liegt jetzt eine lange Wegstrecke. Wie groß war die Herausforderung, die Vision in Software zu „gießen“?

Die ersten Schritte sind die spannendsten und schwierigsten. Wir waren nicht die typischen Techies, die schon mit 12 Jahren angefangen haben, zu programmieren. Erst im Informatikstudium sind wir mit den Programmierkonzepten in Berührung gekommen und haben uns dann im Selbststudium die Frameworks beigebracht. Apple hat es einem damals schon leicht gemacht, dass man sich eine Application baut. Das war Anfang 2000er – weit bevor es die App Stores gab. Klar, es war ein sehr langer Weg von der Vision zum Produkt – aber je klarer man das Ziel vor sich sieht, desto mehr hat man auch den Durchsetzungswillen, wenn es es mal nicht so läuft oder man nicht weiter weiß.

Eine besondere Ehre für einen Entwickler: Karim Morsy auf der Bühne einer Apple-Keynote im Jahr 2016. Foto: Apple
Eine besondere Ehre für einen Entwickler: Karim Morsy auf der Bühne einer Apple-Keynote im Jahr 2016. Foto: Apple

Was ich faszinierend finde und was in heutigen Zeiten alles andere als selbstverständlich ist: Ihr seid als Firma profitabel und habt Euch stets selbst finanziert, seid also self-funded. Wie groß ist Euer Team mittlerweile?

Wir sind jetzt ca. 15 bis 20 Leute. Dafür, wie lange es uns schon gibt, ist das tatsächlich relativ klein. Aber wir haben auch sehr klein angefangen, das war immer schon in unserer DNA. Erst waren wir zu dritt. Wir sind lange klein geblieben, eben auch, weil wir self-funded arbeiten. Als wir anfingen, war das noch eine ganz andere Zeit, da gab es noch nicht diese Blase, wo der Erfolg eines Start-Ups darin bestand, einen großen VC (Venture Capitalist, Wagniskapital) an Land zu ziehen.  Wir hatten anfangs nicht einmal einen Business Plan, sondern nur diese verrückte Idee als Studenten und waren sehr überzeugt und besessen von dieser Idee. Und ich glaube, dann ist es auch gar nicht so entscheidend, ob man Finanzmittel von außen bekommt oder nicht. Am Anfang stand für uns die Vision, DJ-ing für jedermann möglich zu machen. Ich glaube, der Erfolg kommt auch von selbst, wenn man seinen Werten treu ist und wirklich sagt: Customer comes first, der Kunde ist König.

Um erfolgreich zu sein, muss man immer ein paar Schritte voraus sein. Andererseits macht es Apple einem heute wirklich einfach als Entwickler.

Über das Entwickeln von Apps im Jahr 2020

Ist so ein Werdegang wie Eurer in heutigen Zeiten noch denkbar?

Eine sehr gute Frage. Die Zeiten haben sich sicherlich geändert. Es ist teils schwieriger und teils einfacher geworden. Früher war die Zahl der Mac-Entwickler deutlich überschaubarer. Die wirklich großen konnte man an einer Hand abzählen. Heute sind es Millionen von Entwicklern. Es ist eine ganz andere kompetitive Landschaft, in der man sich bewegt. Die Ansprüche werden höher. Man muss den Nagel schon wirklich auf den Kopf treffen, denn es kommen schnell andere Entwickler um die Ecke, die das Gleiche machen. Um erfolgreich zu sein, muss man immer ein paar Schritte voraus sein. Andererseits macht es Apple einem heute wirklich einfach als Entwickler. Ich muss nur einen Developer Account eröffnen und schon kann ich in über 150 Länder Apps vertreiben. Wir haben früher noch überlegen müssen: Wie setzen wir das überhaupt erstmal auf? Wir haben CDs gebrannt und die in mehrere Länder verschickt. Das war schon alleine vom Aufwand her eine Herausforderung, das mit dem vorhandenen Personal hinzubekommen. Wir mussten uns mit Zollfragen beim Versand in die USA befassen. Das kann man sich heute kaum noch vorstellen. All das ist viel, viel einfacher geworden. Auch die Vermarktung. Wir haben damals noch auf der Macworld (Messe) einen Stand aufgebaut, der dann fast zusammengekracht wäre. (lacht) Das waren wirklich noch Zeiten, wo es viel schwieriger war, ein Produkt zu vermarkten. Da gab es in der Form auch noch nicht die heutigen Viralitätseffekte im Internet. 

Wenn man Euer Angebot betrachtet, unterstützt Ihr zwar alle relevanten Plattformen. Aber es scheint doch Apple im Fokus zu stehen. Täuscht das?

Nein, wir haben damals als Mac-only-Software angefangen. Unsere Wurzeln stecken schon in der Apple-Technologie. Das hat sehr viel mit unserem Denken über Design zu tun. Wir haben auch zwei Apple Design Awards gewonnen. Diese Plattform war einfach naheliegend für Soundanwendungen und Grafik.  Insofern sind wir schon sehr eingefleischte Entwickler für das Apple Ecosystem. Nichtsdestotrotz sind wir mit der Zeit so populär geworden, dass Nutzer sich zum Beispiel eine Windows-Version wünschten. Wir kooperieren außerdem auch mit Hardwareherstellern und da ist es wirklich einfacher, sämtliche Plattformen abzudecken. Deshalb sind wir Cross-platform. 

Neue Möglichkeiten: Der M1 Chip - der erste Apple Silicon - hat auch die Neural Engine, die deutlich schnelleres Machine Learning ermöglicht. Foto: Apple
Neue Möglichkeiten: Der M1 Chip – der erste Apple Silicon – hat auch die Neural Engine, die deutlich schnelleres Machine Learning ermöglicht. Foto: Apple

Sprechen wir über djay Pro AI. Was mich beim Herumspielen mit der App fasziniert hat, ist, dass ich auch als recht unmusikalischer Mensch schnell zu Ergebnissen komme. Und dass es sogar Spaß macht. Andererseits weiß ich als Hobbyentwickler: Wenn etwas Beeindruckendes ganz einfach funktioniert, ist die Entwicklung meist hochkompliziert – wie das bei der AI?

Absolut. Da haben wir ziemlich geschwitzt, das in Echtzeit hinzubekommen. Die letzten Jahrzehnte war das für DJs und Produzenten immer der heilige Gral, genau das hinzubekommen, was das Gehirn letztlich von selbst macht – in Echtzeit Instrumente und Stimmen zu trennen. Gerade für DJs, die versuchen, Stilrichtungen anhand bestehender Musik neu zu erfinden, ist die Möglichkeit des Aufsplittens ein Traum. Seit den 1960-er-Jahren gibt es Equalizer. Damit versuchen DJs bestimmte Frequenzen zu dämpfen, so dass sich bei einem möglichst nahtlosen Übergang zweier Songs deren Melodien, Stimmen, usw. nicht zu sehr in die Quere kommen. Aber das ist nicht annähernd das, was eine AI-Trennung kann. Dieses Feature gibt DJs ganz neue Möglichkeiten. Ich kann jetzt beispielsweise einen Übergang machen und Stimmen einfach sofort ausblenden, um sie an anderer Stelle wieder nahtlos einzublenden. Oder ich kann ganz neue Remixe machen, indem ich beispielsweise die Gitarre eines Künstlers durch die Stimme eines anderen Künstlers ersetze. Wenn ich mir anschaue, wie Genres wie Hiphop entstanden sind: Das waren DJs, die haben Elemente aus Funk und Jazz neu kombiniert, und plötzlich ist etwas ganz Neues entstanden. Ähnlich die elektronische Musik. Und deshalb glauben wir, dass das einen sehr starken kulturellen Einfluss auf Musik haben kann, weil die Kreativen jetzt ganz neue technologischen Möglichkeiten haben, bestehende Musik neu zu interpretieren.

AI fängt jetzt gerade erst an, aus den Kinderschuhen heraus zu kommen.

Über die Neural Engine mit 16 Kernen

Der Neural Mix macht sich – der Name lässt es erahnen – die Neural Engine zunutze. Wie wichtig sind die Verbesserungen im A14 dafür?

Die Verbesserungen  sind sehr maßgeblich. AI fängt jetzt gerade erst an, aus den Kinderschuhen heraus zu kommen. AI war am Anfang oft so, dass etwas im Hintergrund analysiert und am Ende spuckt der Rechner ein Ergebnis aus. Da wurde zum Beispiel ein Kuh auf einem Foto erkannt oder ein Hund. Für viele entstand so der Eindruck, dass das nicht annähernd so intelligent ist wie ein Mensch. Was das menschliche Gehirn auszeichnet, ist gerade die Echtzeitverarbeitung. Ich sehe etwas und kann sofort erkennen, was es ist, oder ich höre Musik und nehme automatisch getrennte Stimmen bzw. Instrumente wahr. Dort will man als Softwareentwickler und natürlich auch als Nutzer hin, dass es sich wirklich anfühlt wie eine Intelligenz, die leibt und lebt. Dass es buchstäblich sofort passiert. Dafür braucht man aber eine unglaubliche Rechenleistung. Und deshalb fängt es jetzt auch erst an, dass es solche Anwendungen gibt. Daran merkt man den Unterschied dieser neuen Prozessoren und der Neural Engine zu Geräten, die das nicht haben. Wir haben mit Apples neuen Prozessoren teilweise Performance-Boosts von bis zu Faktor 15 gesehen. 

Der Nutzer sieht: Da ist etwas drastisch besser geworden. Die Entwickler freut es, wie Du gerade sagst. Aber reicht Euch das erstmal für den Moment oder sagt Ihr: Da muss jetzt schnell noch mehr Leistung her?

Das war so ein großer Quantensprung – damit ist man als Programmierer jetzt erstmal sehr gut bedient. Andererseits: Wenn Rechner schneller werden, bringt das Entwickler auf neue Ideen. Zu schnell gibt es also nie aus Entwicklersicht. Wir verfolgen es mit großer Freude und Spannung und schauen, was uns das ermöglicht in der App-Entwicklung. Natürlich: Je weniger Latenz desto besser, je schneller desto besser. Aber jetzt im Moment ist das schon erstmal ein ziemlicher Durchbruch.

Ich glaube, es fängt jetzt erst so richtig an mit den Durchbrüchen in der Rechenleistung. Man braucht als Entwickler nicht mehr die Serverfarmen, um etwas in Sachen AI zu verarbeiten, sondern man kann es on-device – auf dem mobilen Gerät – ausführen.

Wie die Neural Engine im A14 und M1 die Zukunft der Apps beeinflusst

Ein schnelles Auto alleine genügt nicht, es braucht auch einen talentierten Fahrer. Ähnlich ist es mit Hard- und Software.  Damit die Maschine lernen kann, braucht sie selbst gute Lehrer. Ich habe den Eindruck: Viele Entwickler sind noch gar nicht auf den Zug aufgesprungen, oder?

Da ist durchaus etwas dran. Es ist irgendwie auch das Henne-Ei-Problem. Es muss erstmal die Hardware da sein, die die Motivation auslöst. Ich glaube, es fängt jetzt erst so richtig an mit den Durchbrüchen in der Rechenleistung. Man braucht als Entwickler nicht mehr die Serverfarmen, um etwas in Sachen AI zu verarbeiten, sondern man kann es on-device – auf dem mobilen Gerät – ausführen. Ich glaube, das bringt auch eine Bewegung hinein. Es sind Sachen möglich, die vorher nicht möglich waren.    

Für Euch gab es neben den Apple Design Awards schon weitere großen Ehren seitens Apple. Du hast vor einigen Jahren in einer Apple-Keynote auf der Bühne gestanden, als das erste Mal die Touch Bar auf dem MacBook Pro präsentiert wurde, und hast das am Beispiel Eurer Software demonstriert. Die ganzen Apple-Chefs saßen in der ersten Reihe und schauten Dir zu, ebenso die Apple-interessierte Weltöffentlichkeit. Wie aufgeregt ist man in so einem Moment? 

Wenn ich mich zurück erinnere: Es hat schon etwas leicht Surreales. Klar, man ist schon aufgeregt. Man hat diese Bühne, diese Ehre, sein Produkt zu zeigen. Durch meine Klavierspielertätigkeit war ich schon in gewisser Weise gewohnt, mit der Nervosität umzugehen. Aber es ist natürlich ein sehr besonderes Gefühl, eine große Ehre, dort stehen zu dürfen.

Im September 2019 war Apple-Chef Tim Cook in München zu Gast und besuchte Algoriddim. Foto: Apple
Im September 2019 war Apple-Chef Tim Cook in München zu Gast und besuchte Algoriddim. Foto: Apple

Tim Cook war auch in München bei Euch zu Besuch. Was war das für ein Gefühl?

Das war tatsächlich noch einen Ticken surrealer. Es war in einem entspannteren Setting, gewissermaßen in unserem Wohnzimmer, in unserem Münchener Büro. Das war natürlich eine ganz große Ehre. Wir sind eingefleischte Apple-Entwickler seit Jahren. Das war ein sehr besonderer Moment in unserer Historie und sehr motivierend.

Peter Kolski, der Augmented Berlin entwickelt hat, und auch von Tim Cook besucht wurde, sagte mir in einem Gespräch, dass er herausragend fand, wie sehr sich Tim Cook wirklich dafür interessierte, was er macht. Ging Euch das genauso?

Ja, er war absolut authentisch und dadurch hatte es etwas Motivierendes, wie er sich wirklich für das ganze Team interessierte. Das war schon etwas Einmaliges.

Zurück zu den vergangenen Wochen und den vielen Neuigkeiten: Was war dein persönliches Highlight unter all den iPhones, Macs, iPads und Apple Watches?

Weil es für unser Handwerk sehr wichtig ist: Mich persönlich hat am meisten der Mac gefreut, weil es der größte Sprung zwischen den Generationen war. Das war schon ein besonderer Performance-Schub.

Geschrieben von
Malte
Diskutiere mit

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.

1 Kommentar
  • Ich hatte diesen Bericht nun schon seit Monaten hier geöffnet auf dem Mac rumliegen und nun gelesen. Sehr beeindruckend!
    Ich denke ebenfalls das uns AI schon in nächster Zukunft zu ganz anderen Lösungen mit besseren Ergebnissen wie bisher führen wird und das in vielen Bereichen und sehe die M-Chips von Apple dort als einen großen Antreiber auch mit Auswirkungen außerhalb des Apple Ökosystems, denn andere Firmen werden diesen Weg in einigen Jahren wohl auch beschreiten.

    Von einer Aufrüstbarkeit müssen wir uns dann allerdings verabschieden, die Zeiten sind wohl vorbei, aber warum auch nicht? Wenn ein Gerät so gut ist das es 8-10 Jahre verwendet werden kann und zu großen Teilen zu recyceln ist, mal im Ernst, wer kauft dann nicht nach dieser Zeit nicht gerne ein neues Gerät. Wir werden uns immer weniger um die Rechner kümmern (müssen), sondern mehr um die Anwendungsfälle, das ist der Weg… so sehe ich es zumindest.

Willkommen beim Apfelfunk

Der Apfelfunk ist ein Podcast über Apple-Themen, der wöchentlich erscheint.

Jean-Claude Frick und Malte Kirchner berichten und bewerten darin die Neuigkeiten. Ein Podcast über Apple, Gadgets & mehr.

Hier klicken für mehr Infos

Lade Dir die Apfelfunk-App:
iOS Android
Mehr Infos über die App

Unterstütze den Apfelfunk:
Spenden bei Steady Paypal & mehr

So hörst Du uns

Den Apfelfunk kannst Du Dir hier auf unserer Website oder in der Podcast-App Deiner Wahl anhören. Suche einfach nach Apfelfunk.

Oder klicke einen der folgenden Links:

Apple Podcasts
Spotify
Google Podcasts
RSS-Feed abonnieren