ECLI:DE:BGH:2024:300724UXZR105.22.0 BUNDESGERICHTSHOF IM NAMEN DES VOLKES URTEIL X ZR 105/22 Verkündet am: 30. Juli 2024 Anderer Justizangestellte als Urkundsbeamtin der Geschäftsstelle in der Patentnichtigkeitssache - 2 - Der X. Zivilsenat des Bundesgerichtshofs hat auf die mündliche Verhandlung vom 30. Juli 2024 durch den Vorsitzenden Richter Dr. Bacher, den Richter Dr. Deichfuß, die Richterinnen Dr. Kober-Dehm und Dr. Rombach und den Rich- ter Dr. Crummenerl für Recht erkannt: Die Berufung gegen das Urteil des 2. Senats (Nichtigkeitssenats) des Bundespatentgerichts vom 5. Mai 2022 wird auf Kosten der Be- klagten zurückgewiesen. Von Rechts wegen - 3 - Tatbestand: Die Beklagte ist Inhaberin des mit Wirkung für die Bundesrepublik Deutschland erteilten europäischen Patents 1 290 889 (Streitpatents), das am 7. Mai 2001 unter Inanspruchnahme zweier US-amerikanischer Prioritäten vom 8. Juni 2000 und 16. Februar 2001 angemeldet wurde und Spracherkennung für Kabelfernsehen oder Videoverteildienste betrifft. Patentanspruch 1, auf den elf weitere Ansprüche zurückbezogen sind, lau- tet in der Verfahrenssprache: A method of using a back channel containing a multiplicity of identified speech channels from a multiplicity of user sites (1100) presented to a speech recognition system (3200) at a wireline node (1300) of a network supporting at least one of cable television delivery and video delivery, comprising the steps of: receiving said back channel to create a received back channel, partitioning said received back channel into a multiplicity of received identified speech channels; processing each of said multiplicity of said received identified speech channels with said speech recognition system to create corresponding recognized speech content for each received identified speech channel; responding to said recognized speech content to create a recognized speech content response that is unique for each of said received identified speech chan- nels; and individually controlling the delivery of entertainment and information services to each user site (1100) in accordance with said recognized speech. Patentanspruch 13, auf den achtzehn weitere Ansprüche zurückbezogen sind, schützt ein System zur Ausführung eines solchen Verfahrens. Die Klägerin, die wegen Verletzung des Streitpatents gerichtlich in An- spruch genommen wird, hat das Schutzrecht im Umfang der Ansprüche 1, 2 ,13 und 14 angegriffen und geltend gemacht, die Erfindung sei nicht so offenbart, dass ein Fachmann sie ausführen könne, und der angegriffene Gegenstand gehe über den Inhalt der ursprünglich eingereichten Unterlagen hinaus und sei nicht patentfähig. 1 2 3 4 - 4 - Die Beklagte hat das Streitpatent in der erteilten Fassung und hilfsweise in acht geänderten Fassungen verteidigt. Das Patentgericht hat das Patent im beantragten Umfang für nichtig er- klärt. Dagegen richtet sich die Berufung der Beklagten, die ihr erstinstanzliches Begehren mit Ausnahme der Hilfsanträge 2 und 3 weiterverfolgt. Die Klägerin tritt dem Rechtsmittel entgegen. Entscheidungsgründe: Die zulässige Berufung hat in der Sache keinen Erfolg. I. Das Streitpatent betrifft Spracherkennung für Kabelfernsehen oder Videoverteildienste. 1. Nach den Ausführungen in der Streitpatentschrift waren im Stand der Technik sprachgesteuerte Funktionen auf einige wenige Anwendungen be- schränkt. Diese Systeme böten typischerweise nur eine begrenzte Zahl von Be- fehlen, die Erkennungs-Effizienz sei nur mittelmäßig und oft sei ein Sprachtrai- ning erforderlich (Abs. 2). Eine andere Technologie, die die Erkennung natürlicher Sprache ermögli- che, erfordere Hunderte von Megabytes an Hauptspeicher. Sie werde von Ver- sorgungsunternehmen und der New Yorker Börse zur Rechnungserstellung ein- gesetzt (Abs. 4). Diese Innovationen stellten keine Lösung bereit, um in Kabelfernsehnet- zen und Videoverteilsystemen eine Benutzer-Identifizierung, Echtzeit-Auktionen oder Vertragsabschlüsse zu unterstützen (Abs. 31). 5 6 7 8 9 10 11 - 5 - 2. Das Streitpatent betrifft vor diesem Hintergrund das technische Problem, Spracherkennung in Kabelfernsehnetzen oder Videoverteildiensten be- reitzustellen. 3. Zur Lösung schlägt das Streitpatent in Patentanspruch 1 ein Ver- fahren vor, dessen Merkmale sich wie folgt gliedern lassen: 1.1 A method of using a back chan- nel Verfahren zur Verwendung eines Rückkanals, 1.1.1 containing a multiplicity of iden- tified speech channels from a multiplicity of user sites (1100) der eine Vielzahl von identifizierten Sprachkanälen von einer Vielzahl von Teilnehmerstandorten (1100) enthält, 1.1.2 presented to a speech recogni- tion system (3200) at a wireline node (1300) of a network sup- porting at least one of cable television delivery and video delivery, die eingegeben wird in ein Sprach- erkennungssystem (3200) an einem Leitungs-Knoten (1300) eines Netz- werks, das mindestens Kabelfern- sehen oder Video-Verteilung unter- stützt, 1.2 comprising the steps of: das folgende Schritte umfasst: 1.2.1 receiving said back channel to create a received back chan- nel, Empfang des Rückkanals zur Er- zeugung eines empfangenen Rück- kanals; 1.2.2 partitioning said received back channel into a multiplicity of re- ceived identified speech chan- nels; Aufteilung des empfangenen Rück- kanals in eine Vielzahl empfange- ner identifizierter Sprachkanäle, 12 13 14 - 6 - 1.2.3 processing each of said multi- plicity of said received identified speech channels with said speech recognition system to create corresponding recog- nized speech content for each received identified speech channel; Verarbeitung jedes aus der Vielzahl empfangener identifizierter Sprach- kanäle mit dem Spracherkennungs- system, um für jeden empfangenen identifizierten Sprachkanal einen entsprechenden erkannten Sprachinhalt zu erzeugen; 1.2.4 responding to said recognized speech content to create a recognized speech content re- sponse that is unique for each of said received identified speech channels; and Reagieren auf den erkannten Sprachinhalt, um eine Reaktion auf den erkannten Sprachinhalt zu er- zeugen, die für jeden der empfan- genen identifizierten Sprachkanäle individuell ist; und 1.2.5 individually controlling the delivery of entertainment and information services to each user site (1100) in accordance with said recognized speech. individuelle Steuerung der Lieferung von Unterhaltungs- und Informati- onsdiensten zu jedem Teilnehmer- standort (1100) in Übereinstimmung mit der erkannten Sprache. 4. Patentanspruch 13 schützt ein System zur Ausführung eines sol- chen Verfahrens und unterliegt derselben Beurteilung wie Patentanspruch 1. 5. Einige Merkmale bedürfen der näheren Erläuterung. a) Ein Rückkanal im Sinne von Merkmal 1.1 ist ein Übertragungsweg, der die Übermittlung von Informationen von einem Nutzer an eine Sendestation ermöglicht. In Merkmal 1.2.1 bezeichnet dieser Begriff Informationen, die auf einem solchen Kanal übertragen werden. b) Ein Leitungsknoten im Sinne von Merkmal 1.1.2 ist nach der Defi- nition in der Beschreibung des Streitpatents ein Netzwerkknoten, der Video- oder Kabelfernseh-Dienste für mehrere Teilnehmer bereitstellt (Abs. 5 Z. 49-53). 15 16 17 18 - 7 - c) Der Begriff "identifizierter Sprachkanal" (identified speech channel) wird in den Merkmalen 1.1.1, 1.2.2, 1.2.3 und 1.2.4 sowohl für einen Übertra- gungsweg verwendet, auf dem Sprachinformationen übermittelt werden, als auch für Sprachinformationen, die auf einem solchen Kanal übertragen werden. Die Identifizierung eines Sprachkanals eröffnet die Möglichkeit, den Kanal einem Nutzerstandort oder einem einzelnen Nutzer zuzuordnen. So können zum Beispiel unterschiedliche Standorte anhand ihrer Adresse (Abs. 97) und unter- schiedliche Nutzer anhand von Charakteristika ihrer Stimme (Abs. 108 f.) identi- fiziert werden. Patentanspruch 1 schreibt keine dieser Möglichkeiten zwingend vor. Folg- lich genügt es zur Identifizierung eines Sprachkanals, wenn dieser von anderen Kanälen - einschließlich anderer Sprachkanäle - unterschieden werden kann. d) Nachdem der Rückkanal gemäß Merkmal 1.2.2 in eine Vielzahl identifizierter Sprachkanäle aufgeteilt worden ist, wird jeder Sprachkanal gemäß Merkmal 1.2.3 der Spracherkennung zugeführt, um Sprachinhalte zu erkennen. aa) Wie das Patentgericht zutreffend ausgeführt hat, müssen hierzu die übertragenen Sprachsignale in Wörter oder sonstige Buchstabenfolgen umge- wandelt werden. bb) Aus den Merkmalen 1.2.4 und 1.2.5, wonach in Reaktion auf einen erkannten Sprachinhalt bzw. in Übereinstimmung mit der erkannten Sprache die Lieferung von Unterhaltungs- und Informationsdiensten individuell gesteuert wer- den muss, ergibt sich ferner, dass der erkannte Sprachinhalt in irgendeiner Weise interpretiert werden muss, damit die erforderliche Reaktion erfolgen kann. Nach der Beschreibung kann die Verarbeitung erkannter Sprache in der Weise erfolgen, dass Schlüsselwörter von gesprochenen Kommandos erkannt und angezeigt werden. Dies kann im Navigations-Modus, im Such-Kontext oder in anderen Zusammenhängen und Betriebsarten angewendet werden (Abs. 37). 19 20 21 22 23 24 25 - 8 - Das System kann auf ein Kommando aber auch dadurch reagieren, dass es die gesprochene Anweisung visuell darstellt. Damit kann angezeigt werden, dass Schlüsselwörter erkannt worden sind. Diese Darstellung kann in Form von Text oder Symbolen erfolgen (Abs. 38). cc) Entgegen der Auffassung der Berufung ergibt sich aus Patentan- spruch 1 vor diesem Hintergrund nicht, dass zwingend die grammatikalische Be- deutung von erkannten Zeichenfolgen, Wörtern oder Sätzen erkannt werden muss. Die von der Berufung insoweit herangezogenen Ausführungen in der Be- schreibung, wonach der Sprachprozessor über eine Grammatik-Definition verfü- gen muss und eine solche Struktur oft die Wörter, die am wahrscheinlichsten gesprochen werden, die Reihenfolge, in der die Wörter erscheinen können, und die Bedeutung verschiedener Sequenzen von Wörtern enthalte (Abs. 98), führen schon deshalb nicht zu einer abweichenden Beurteilung, weil die genannten Funktionen nur als häufig vorhanden, nicht aber als notwendig bezeichnet wer- den. Unabhängig davon schreibt Patentanspruch 1 weder den Einsatz einer Grammatik vor noch bestimmte Funktionen, die diese aufweisen muss. Aus den bereits erwähnten Ausführungen zu möglichen Reaktionen auf erkannte Sprache (Abs. 37 f.) ergeben sich keine weitergehenden Schlussfolge- rungen. Danach genügt es vielmehr, wenn ein erkannter Text angezeigt oder als Suchbegriff verwendet wird. Hierfür ist es nicht zwingend erforderlich, die Bedeu- tung des Texts zu erfassen, ihn einem bestimmten Kontext zuzuordnen oder ihn mit vordefinierten Schlüsselwörtern zu vergleichen. Die Zuordnung zu einem Kontext, etwa dergestalt, dass von verschiede- nen möglichen Bedeutungen eines Worts je nach der Eingabesituation nur ein- zelne Bedeutungen herangezogen werden, ist weder im Patentanspruch noch in der Beschreibung vorgesehen. Der Abgleich mit Schlüsselwörtern ist in der Be- schreibung (Abs. 38) nur als ein mögliches Beispiel erwähnt und in Patentan- spruch 1 ebenfalls nicht zwingend vorgesehen. 26 27 28 29 30 - 9 - e) Zu den Unterhaltungs- oder Informationsdiensten, deren Lieferung gemäß Merkmal 1.2.5 in Übereinstimmung mit der erkannten Sprache - also mit dem erkannten Sprachinhalt im Sinne von Merkmal 1.2.4 - individuell gesteuert wird, gehören Video on Demand, Pay per View, Online-Shopping und das Inter- net, aber auch die Steuerung von Kanälen (Abs. 35). Für eine individuelle Steuerung im Sinne von Merkmal 1.2.5 genügt es, dass die Lieferung jeweils entsprechend dem den einzelnen Nutzern zuzuord- nenden erkannten Sprachinhalt erfolgt. Dies schließt nicht aus, dass derselbe Gegenstand an mehrere Nutzer geliefert wird, wenn diese jeweils inhaltsgleiche Befehle übermittelt haben. Entgegen der Auffassung der Berufung ist die Art und Weise der Lieferung in Merkmal 1.2.5 nicht festgelegt. Insbesondere ist weder dem Patentanspruch noch der Beschreibung zu entnehmen, dass die Lieferung mittels einer Punkt-zu- Punkt-Verbindung erfolgen muss. Erforderlich ist lediglich eine Lieferung an den- jenigen Nutzer, der eine entsprechende Anforderung übermittelt hat. Dies kann auch dadurch geschehen, dass die Lieferung auf einem Broadcast-Kanal erfolgt und dem jeweiligen Adressaten durch einen Schlüssel oder ähnliche Mittel der individuelle Zugang ermöglicht wird. II. Das Patentgericht hat seine Entscheidung, soweit für das Beru- fungsverfahren von Interesse, im Wesentlichen wie folgt begründet: Der Gegenstand des erteilten Patentanspruchs 1 beruhe gegenüber der internationalen Patentanmeldung 00/24198 (NK11) nicht auf erfinderischer Tä- tigkeit. NK11 zeige ein Verfahren zur Erkennung von Sprachdaten, die über den Rückkanal eines Kabelfernsehnetzes übermittelt würden. Hierbei sei selbstver- ständlich, dass es mehrere Sprachkanäle gebe und diese vor der Übermittlung festgelegt und damit im Sinne von Merkmal 1.1 identifiziert werden müssten. Ebenfalls selbstverständlich sei, dass die Daten vor der Konvertierung in Text 31 32 33 34 35 36 - 10 - netzwerkseitig empfangen würden. Der in Figur 1 von NK11 dargestellte De- multiplexer (18) diene aus Sicht des Fachmanns, eines Elektroingenieurs der Fachrichtung Nachrichtentechnik mit mehrjähriger Erfahrung in der Konzeption und Entwicklung von Kabelfernseh- und Videoverteilnetzwerken einschließlich der zugehörigen Benutzerschnittstellen und Kenntnis der jeweils gültigen Stan- dards für den Betrieb solcher Netzwerke, der Aufteilung der Sprachdatenpakete verschiedener Teilnehmer, die im Rahmen eines solchen zeitgesteuerten Multi- plex-Verfahrens (Time Division Multiple Access, TDMA) an den Server (13) über- mittelt worden seien. Das Zurücksenden der erkannten Texte an die Set-Top- Boxen und das Bereitstellen dieser Texte zur Verwendung in einer bestimmten interaktiven Anwendung sei als eine individuelle Steuerung der Lieferung eines Informationsdienstes im Sinne von Merkmal 1.2.5 anzusehen. NK11 führe im Kontext mit der Erkennung von Handschrift mehrere solche interaktiven Anwen- dungen an, nämlich einen E-Mail-, einen Fax- und einen elektronischen Einkaufs- dienst, und sehe Spracherkennung durchweg als Alternative zur Handschriften- erkennung vor. Nicht unmittelbar offenbart sei eine individuelle Steuerung in Bezug auf Unterhaltungsdienste. Dieses Teilmerkmal sei aber nahegelegt gewesen. So könne das in NK11 beschriebene System in etlichen interaktiven Anwendungen verwendet werden, die auf einer Set-Top-Box abliefen. Das bedeute, dass diese Anwendungen die von dem Server bereitgestellten Textdaten verwendeten. Die mittels interaktiver Anwendung zu erwerbenden Produkte könnten auch Daten- folgen - z.B. Videos oder elektronische Zeitschriftenartikel - sein. Ein jeweiliger Teilnehmer bestimme durch seine mündlichen Äußerungen die Art und den Be- deutungsinhalt der gekauften Datenfolgen. Hinsichtlich Patentanspruch 2 finde der Fachmann in einer Veröffentli- chung zu einem Rückkanal im Kabelfernsehsystem (Digital Video Broadcasting (DVB) - Interaction channel for Cable TV distribution systems (CATV), European Telecommunications Standards Institute, Januar 1998, NK16) den Hinweis, dass 37 38 - 11 - die MAC- und NSAP-Adressen der Set-Top-Boxen - also bestimmte Kennzeich- nungen - herangezogen würden, um die von verschiedenen Teilnehmern auf dem Rückkanal übertragenen Informationen netzwerkseitig zu unterscheiden. Im Übrigen müsse auch in der Sendestation eine Information darüber vorhanden sein, an welchen Teilnehmer die Ergebnisse eines Spracherkennungsvorgangs zu übermitteln seien. Dazu sei es zweckmäßig, entsprechende Identifikationsin- formationen des zugehörigen Teilnehmers bzw. der zugehörigen Set-Top-Box über den Rück- bzw. Sprachkanal zu senden. NK11 sei ferner zu entnehmen, dass der Teilnehmer im Rahmen des elek- tronischen Einkaufsdienstes eine Lieferadresse angebe. Stimme die Adresse mit der Adresse des Teilnehmers und dem Standort der Set-Top-Box überein, be- zeichne sie einen Teilnehmerstandort. Die mit den Hilfsanträgen verteidigten Gegenstände seien durch NK11, NK16, eine Veröffentlichung von IBM (Speech Recognition Methods for Control- ling Cable Television, IBM Technical Bulletin, Vol. 38 Nr. 8 S. 285-287, August 1995, NK12) und das US-Patent 5 774 859 (NK9) nahegelegt. III. Diese Beurteilung hält der Überprüfung im Berufungsrechtszug stand. 1. Zu Recht hat das Patentgericht entschieden, dass NK11 den ange- griffenen Gegenstand mit Ausnahme eines Teils von Merkmal 1.2.5 offenbart. a) NK11 befasst sich mit der Verwendung eines Servers zur Umwand- lung von vom Benutzer bereitgestellten Informationen in ein Datenformat, das von einer interaktiven Fernsehanwendung verwendet werden kann. aa) In der Beschreibung von NK11 wird ausgeführt, interaktive Fern- sehsysteme könnten verwendet werden, um Benutzern eine Vielzahl von Diens- ten bereitzustellen, etwa Text- und Grafikinformationen, um die Interaktion zu 39 40 41 42 43 44 - 12 - vereinfachen, oder Audio- und Videoströme, die mit normalen Fernsehprogram- men verknüpft seien. Solche Systeme könnten für Marketing- und Weiterbil- dungszwecke eingesetzt werden. Zuschauer könnten beworbene Produkte oder Dienstleistungen bestellen, Informationen bezüglich bestimmter Programme an- fordern oder elektronische Nachrichten (E-Mail) senden. In einem typischen interaktiven Fernsehsystem weise das Fernsehsignal neben dem Audio-Video-Bereich für das Fernsehprogramm einen interaktiven Bereich auf, der aus Anwendungscode oder Steuerinformationen bestehe. Der Anbieter kombiniere die beiden Bereiche in ein einzelnes Signal zur Übertragung an den Empfänger. Die interaktive Funktionalität werde durch eine mit dem Fernseher verbun- dene Set-Top-Box gesteuert. Diese empfange das übertragene Signal und trenne den interaktiven Bereich von dem Audio-Video-Bereich. Wenn der inter- aktive Bereich des Signals eine interaktive Anwendung aufweise, könne die An- wendung ausgeführt werden, während das Fernsehsignal auf den Fernseher übertragen werde. Die Set-Top-Box könne diese Informationen mit Grafiken oder Audioinformationen kombinieren, die durch die interaktive Anwendung ausge- führt würden (S. 1 Z. 26-32). Eine Benutzereingabe sei zum Beispiel bei einem fernsehbasierten Ver- kaufsservice erforderlich, bei dem eine Reihe von Produkten angezeigt würden und der Benutzer diese erwerben könne (S. 1 Z. 38-40). Die Eingabe von Textin- formationen sei bei Messaging-Anwendungen erforderlich, weil der Benutzer die Nachricht und Informationen zum Empfänger eingeben müsse (S. 2 Z. 3-5). Eine Option zur Texteingabe sei die Verwendung einer Tastatur (S. 2 Z. 6). Alternativ könnten Spracheingaben mit Hilfe von Spracherkennungstech- nologie gesampelt und mit einem zuvor gesampelten Sprachmuster verglichen werden, um die vom Benutzer gesprochenen Wörter zu bestimmen (S. 2 Z. 15-18). Diese Technologien erforderten ein hohes Maß an Computerressour- 45 46 47 48 - 13 - cen. Die Anwendungen könnten sehr groß sein und benötigten viel Verarbei- tungszeit, um den erforderlichen Musterabgleich durchzuführen. Diese Techno- logien könnten daher nicht in aktuellen Set-Top-Boxen implementiert werden, die einen sehr beschränkten Speicher und eine sehr beschränkte Verarbeitungska- pazität hätten (S. 2 Z. 21-25). bb) Um dennoch Spracheingaben zu ermöglichen, schlägt NK11 vor, die vom Benutzer eingegebenen Informationen an einen Server zu übertragen, der sich an der Sendestation befinden könne, und die Informationen in Textdaten umwandle. In einer Ausführungsform übertrage der Server die Textdaten zurück an die Empfangsstation, wo sie durch eine Anwendung verwendet werden könn- ten, die in der Set-Top-Box ausgeführt werde. In anderen Ausführungsformen könnten die Textdaten am Server verwendet oder an einen Teil des Systems übertragen werden, der sich von der Set-Top-Box unterscheide (S. 2 Z. 26-36). Bei einer Ausführungsform könnten Informationen mit einem Grafiktablet eingegeben werden. Die dabei entstehende Bilddatei werde von der Set-Top-Box an die Sendestation übertragen und dort mit einem Server in Zeichen- oder Text- daten umgewandelt. Die Textdaten würden zurück an die Anwendung auf der Set-Top-Box übertragen, die die Daten verwende, wie wenn sie direkt von dem Benutzer eingegeben worden wären (S. 2 Z. 37 bis S. 3 Z. 6). Ein Ausführungsbeispiel ist in der nachfolgend wiedergegebenen Figur 1 schematisch dargestellt. 49 50 51 - 14 - Eine Rundsendestation (10) versendet ein interaktives Audio-Video-Signal über Kabel, Satellit oder terrestrischen Funk an eine Vielzahl von Empfangssta- tionen (20). Die Empfangsstation kann zudem Signale über eine Modemverbin- dung mit der Rundsendestation empfangen (S. 4 Z. 6-14). Die Rundsendesta- tion (10) weist eine Fernsehprogrammquelle (11), eine interaktive Anwendungs- quelle (12) und einen Server (13) zur Verarbeitung von Nicht-Textdaten auf. Die von diesen drei Quellen erzeugten Informationen werden in der Regel kompri- miert und in Pakete zusammengefasst (S. 5 Z. 1-10). Die Pakete werden in eine Multiplexeinheit (17) eingespeist, die sie während der Übertragung einstreut. Die eingestreuten Pakete werden dann über die Antenne (19) per Satellit an die Emp- fangsstationen (20) ausgesendet (S. 5 Z. 20-25). Die Set-Top-Box (22) verarbeitet das Signal, um die Fernsehprogramme und die interaktiven Anwendungen zu rekonstruieren. Die rekonstruierten An- wendungen werden in der Set-Top-Box ausgeführt, während die rekonstruierten Fernsehprogramme an den Fernseher (23) weitergegeben werden (S. 5 Z. 26-33). 52 53 - 15 - Als mögliche Anwendung für ein solches System benennt NK11 einen E-Mail-Service für Abonnenten. Der Benutzer könne die E-Mail-Anwendung aus- wählen, die durch den Serviceanbieter bereitgestellt werde, und dann auf dem Grafiktablet eine Nachricht schreiben und die Adresse des Empfängers angeben (S. 9 Z. 23-28). Als weiteres Beispiel wird E-Commerce angeführt. Der Benutzer könne durch einen Online-Katalog blättern, Produkte auswählen und Artikelinforma- tionen über Menüeinträge bereitstellen. Nicht-standardisierte Informationen wie die Lieferadresse müssten über das Grafiktablet eingegeben werden (S. 10 Z. 14-19). In einer anderen Ausführungsform könne der Benutzer diese Informatio- nen über Sprache eingeben. Der Benutzer könne hierzu ein Mikrofon oder Tele- fongerät verwenden (S. 10 Z. 20-21). Die Sprachdaten würden an den Server übermittelt, der die Spracherkennungssoftware verwende, um die Sprachdaten in Textdaten umzuwandeln. Die Textdaten würden an die Set-Top-Box zurück- gegeben, wo sie dem Benutzer angezeigt werden könnten. Der Benutzer könne den Text korrigieren oder bestätigen, dass der Text genau aus den Sprachdaten erzeugt worden sei (S. 10 Z. 25-27). b) Damit sind die Merkmale 1.1 und 1.2.1 offenbart. Eingegebene Sprachdaten werden auf einem Rückkanal übertragen. c) Entgegen der Auffassung der Beklagten ist auch Merkmal 1.1.1 of- fenbart. aa) In NK11 wird zwar nicht ausdrücklich erwähnt, dass Sprachdaten, die auf dem Rückkanal an die Sendestation übermittelt werden, von einer Viel- zahl von Teilnehmern stammen können. Hinsichtlich des umgekehrten Übertra- gungsweges wird aber mehrfach ausgeführt, dass mehrere Empfänger (S. 4 Z. 9/10) bzw. eine Reihe von Zuschauern (S. 3 Z. 30; S. 5 Z. 2) vorhanden sind. 54 55 56 57 58 59 60 - 16 - Dass es mehrere Empfänger gibt, folgt überdies schon daraus, dass die interak- tiven Informationen zusammen mit Fernsehsignalen übertragen werden. bb) NK11 offenbart auch eine Identifikation der Sprachkanäle im Sinne der Merkmale 1.1.1, 1.2.2 und 1.2.3. Dies ergibt sich aus den Ausführungen, wonach die vom Server aus den Bild- oder Sprachdaten erzeugten Texte von der Set-Top-Box wie eine lokale Eingabe verarbeitet werden können. Um dies zu ermöglichen, müssen die Texte und die zu ihrer Erzeugung verwendeten Daten einem bestimmten Empfangsge- rät zugeordnet werden. Dass NK11 nicht beschreibt, wie dies im Einzelnen ge- schieht, ist unerheblich, weil Patentanspruch 1 insoweit keine Vorgaben enthält. d) Merkmal 1.1.2 ist ebenfalls unmittelbar und eindeutig offenbart. Der Server, der die Spracherkennung ausführt, befindet sich an der Rund- sendestation (10). Diese ist bei dem in NK11 als eine Möglichkeit vorgesehenen Einsatz eines Kabelnetzwerks ein kabelgebundener Leitungsknoten. e) Entgegen der Auffassung der Berufung nimmt NK11 auch das Merkmal 1.2.2 vorweg. Dabei kann dahingestellt bleiben, welchem Zweck der in Figur 1 darge- stellte Demultiplexer (18) dient, zu dem sich die Beschreibung von NK11 nicht verhält. Dass das in NK11 offenbarte System in der Lage sein muss, mehrere Sprachkanäle zu unterscheiden und individuell zu verarbeiten, ergibt sich schon aus dem Umstand, dass mehrere Set-Top-Boxen solche Informationen übertra- gen können und die verarbeiteten Daten an die jeweilige Set-Top-Box zurückge- sandt werden müssen, wenn sie lokal zu verarbeitende Befehle enthalten. Dies genügt zur Offenbarung von Merkmal 1.2.2, weil dieses keine Fest- legungen dazu enthält, in welcher Weise die Aufteilung zu erfolgen hat. 61 62 63 64 65 66 67 - 17 - f) Entgegen der Auffassung der Beklagten ist auch Merkmal 1.2.3 durch NK11 vorweggenommen. Hierzu genügt, dass die Sprachdaten, die auf dem Rückkanal an den Ser- ver (13) übertragen worden sind, durch eine Spracherkennungssoftware in Text- daten konvertiert werden (S. 10 Z. 25-26). Ein Erkennen des Bedeutungsgehalts ist aus den oben dargelegten Gründen nicht erforderlich. g) Ebenfalls zutreffend hat das Patentgericht angenommen, dass NK11 unmittelbar und eindeutig das Merkmal 1.2.4 offenbart. Eine für jeden Sprachkanal individuelle Reaktion auf den erkannten Sprachinhalt liegt schon darin, dass die vom Spracherkennungssystem erzeug- ten Textdaten an die Set-Top-Box des betreffenden Teilnehmers übermittelt wer- den. Dass der Server hierbei nicht den Bedeutungsgehalt des Texts ermittelt, ist aus den oben aufgezeigten Gründen unerheblich. Unabhängig davon sieht NK11 optional weitere Reaktionsmöglichkeiten vor, nämlich die Verarbeitung der Textdaten durch den Server oder durch andere Komponenten des Systems (S. 2 Z. 32-36). h) Zutreffend hat das Patentgericht die in NK11 offenbarten E-Mail- und E-Commerce-Dienste als Informationsdienst im Sinne von Merkmal 1.2.5 an- gesehen. Die Lieferung dieser Dienste wird schon dadurch individuell gesteuert, dass die vom Server erzeugten Textdaten wie eine lokale Eingabe weiterverar- beitet werden. 2. Das damit als einziges nicht unmittelbar und eindeutig offenbarte Teilmerkmal der individuellen Steuerung der Lieferung von Unterhaltungsdiens- ten hat das Patentgericht zutreffend als naheliegend angesehen. 68 69 70 71 72 73 74 75 - 18 - Wie bereits oben aufgezeigt wurde, enthält NK11 den Hinweis, dass mit interaktiven Fernsehsystemen eine Vielzahl von Diensten bereitgestellt werden können (S. 1 Z. 13). Ausgehend davon bestand Anlass, die in NK11 geschilder- ten Funktionen auch für andere Dienste einzusetzen, die in diesem Umfeld in Frage kommen. Dazu gehörte auch das Zurverfügungstellen von Online-Videos oder dergleichen, zumal NK11 mit dem Teleshopping die entgeltliche Überlas- sung von Gegenständen ausdrücklich erwähnt. 3. Da die Beklagte das Streitpatent jeweils in kompletten Anspruchs- sätzen verteidigt, bedürfen die übrigen angegriffenen Ansprüche keiner Erörte- rung. 4. Der mit Hilfsantrag 1 verteidigte Gegenstand ist ebenfalls nicht patentfähig. a) Nach Hilfsantrag 1 soll die erteilte Fassung von Patentanspruch 1 durch das folgende Merkmal ergänzt werden: 1.2.6 wherein the entertainment and in- formation services comprise a Video-On-Demand service and an Interactive Program Guide. wobei die Unterhaltungs- und Infor- mationsdienste einen Video-On- Demand-Dienst und einen interakti- ven Programmführer umfassen. b) Der damit verteidigte Gegenstand lag ausgehend von NK11 aus den bereits oben zu Merkmal 1.2.5 dargelegten Gründen nahe. Sowohl Video on Demand als auch elektronische Programmführer sind Funktionen, die in Kabelfernsehnetzwerken bekannt waren. Deshalb lag es nahe, die in NK11 beschriebene Funktionalität auch für solche Dienste zu nutzen. Die Nutzung für elektronische Programmführer bot sich schon deshalb an, weil NK11 die Anforderung von Informationen bezüglich Programmen ausdrücklich erwähnt (S. 1 Z. 17-18). 76 77 78 79 80 81 82 - 19 - 5. Zutreffend hat das Patentgericht auch den mit Hilfsantrag 4 vertei- digten Gegenstand als nahegelegt angesehen. a) Nach Hilfsantrag 4 soll die erteilte Fassung von Patentanspruch 1 um folgende Merkmale ergänzt werden: 1.2.8' wherein each user site con- tains at least one set top box which is associated with a re- mote control containing a microphone and a talk button; wobei jeder Teilnehmerstandort mindestens eine Set-Top-Box um- fasst, die mit einer Fernbedienung verbunden ist, welche ein Mikrofon und eine Sprechtaste aufweist; 1.2.11 and wherein upon depressing the talk button on the remote control data are sent to the wireline node alerting the system as to the user site and a potential input. und wobei mit Drücken der Sprechtaste auf der Fernbedie- nung Daten an Leitungsknoten gesendet werden, welche das System über den Teilnehmerstand- ort und eine mögliche Eingabe des Benutzers informieren. b) Wie die Berufung im Ansatz zutreffend geltend macht, genügt die Übertragung von Daten, die auf den Teilnehmerstandort hinweisen, zur Verwirk- lichung von Merkmal 1.2.11 nicht. Aus den übertragenen Daten muss zusätzlich hervorgehen, dass eine Benutzereingabe möglich ist, die Teilnehmerdaten also nicht nur aus anderen Gründen übertragen werden. Merkmal 1.2.11 gibt jedoch nicht vor, in welcher Weise die Information, dass eine Benutzereingabe möglich ist, zu übermitteln ist. Folglich genügt jede Information, die eine entsprechende Schlussfolgerung ermöglicht. Solche Infor- mationen können sich auch aus dem Kontext ergeben, etwa daraus, dass auf bestimmte Angaben über den Standort des Teilnehmers grundsätzlich eine Be- nutzereingabe folgt. c) Das Patentgericht ist zutreffend davon ausgegangen, dass der mit Hilfsantrag 4 verteidigte Gegenstand ausgehend von NK11 nahegelegt war. 83 84 85 86 87 88 - 20 - aa) Da NK11 keine näheren Angaben zur Ausgestaltung des Mikrofons und der Set-Top-Box macht, bestand Anlass, sich mit im Stand der Technik be- kannten Ausgestaltungen zu befassen. Anregungen hierzu ergaben sich aus NK9. (1) NK9 betrifft ein System für Abonnementfernsehen, bei dem Infor- mationsprovider Informationen über einen Satelliten und ein Headend an Abon- nentenstandorte liefern (Sp. 8 Z. 39 bis Sp. 12 Z. 26, Figuren 2A-C). Die Informationen umfassen unter anderem analoges Video, analoges Audio und digitales Video (Sp. 8 Z. 47). Bei dem Ausführungsbeispiel nach Fi- gur 2C enthält jeder Teilnehmerstandort ein Teilnehmerendgerät, das mit dem Verteilungsnetz verbunden ist (Sp. 11 Z. 65-67). Die Kopfstellenanlage überträgt Vokabeldaten, die ein Vokabular von ent- sprechenden Lauten oder Wörtern darstellen, an die Teilnehmerendgeräte. Die- ses Vokabular ermöglicht die Sprachsteuerung der Geräte und die Sprachsteue- rung des Zugriffs auf die von der Kopfstellenanlage übertragenen Informationen. Insbesondere kann das übermittelte Vokabular es dem Benutzer ermöglichen, mit gesprochenen Befehlen durch Fernsehprogramme und andere elektronische Programmführer zu navigieren, Kanäle zu wechseln, einen Videorekorder zu steuern, die Lautstärke einzustellen und den Fernseher ein- und auszuschalten (Sp. 14 Z. 61 bis Sp. 15 Z. 3). Als optionales Merkmal schlägt NK9 vor, bei Fernbedienungen, die sprachbezogene Funktionen ausführen, eine Taste zum Sprechen vorzusehen, um Störgeräusche auszuschließen oder die Batterielebensdauer zu verlängern (Sp. 17 Z. 16-19). (2) Wie das Patentgericht zutreffend angenommen hat, handelt es sich bei dem Teilnehmerendgerät um eine Set-Top-Box. 89 90 91 92 93 94 - 21 - Das Teilnehmerendgerät ist zum Beispiel mit einem Fernsehgerät verbun- den. Es empfängt ein Fernsehsignal, das von einem Headend übertragen wird, und gibt dieses an das Fernsehgerät aus (Sp. 11 Z. 66-67; Sp. 12 Z. 5-14). (3) NK9 offenbart auch ein Mikrofon mit Sprachtaste im Sinne des Merkmals 1.2.8'. (4) Angesichts der in NK9 geschilderten Vorteile einer Sprechtaste be- stand für den Fachmann Anlass, auch die Fernbedienung der Set-Top-Box aus NK11 mit einer solchen Taste zu versehen. (5) Ebenfalls zu Recht hat das Patentgericht entschieden, dass eine Signalisierung gemäß Merkmal 1.2.11 nahelag, weil bezüglich des Zeitpunkts, zu dem das für die Spracherkennung eingesetzte System auf eine mögliche Benut- zereingabe aufmerksam gemacht wird, mehrere Lösungen in Betracht kamen, die ihre spezifischen Vor- und Nachteile haben, und die Auswahl zwischen die- sen Möglichkeiten anhand von Zweckmäßigkeitsüberlegungen möglich war. (a) Entgegen der Auffassung der Berufung führt der Umstand, dass NK9 in erster Linie eine lokale Spracherkennung vorschlägt, nicht zu einer ab- weichenden Beurteilung. NK9 weist ausdrücklich darauf hin, dass die Verarbeitung auch an anderen Stellen im System stattfinden kann. In einem Ausführungsbeispiel werden die Töne oder gesprochenen Wörter von einem Teilnehmerendgerät an einen Kno- ten übertragen, der eine Spracherkennungsschaltung enthält (Sp. 33 Z. 49 ff.). Der möglichen Reichweite der Fernbedienung kommt in diesem Zusam- menhang keine Bedeutung zu. Merkmal 1.2.11 sieht lediglich vor, dass ein Drücken der Sprachtaste das Versenden der Informationen an den Server aus- löst, nicht aber, dass diese Informationen von der Fernbedienung unmittelbar an den Server übertragen werden. 95 96 97 98 99 100 101 - 22 - (b) Zu Recht hat das Patentgericht ferner entschieden, dass eine mög- liche Benutzereingabe auch durch Übersenden von leeren Sprachpaketen ange- kündigt werden kann. Wie bereits oben dargelegt wurde, genügt jede Information, aus der auf eine mögliche Benutzereingabe geschlossen werden kann. Eine solche Informa- tion wird auch dann übermittelt, wenn Sprachpakete übertragen werden. Ob NK9 eine solche Vorgehensweise vorsieht, ist unerheblich. Ausschlaggebend ist, dass sie aus den vom Patentgericht angeführten Gründen jedenfalls nahelag. bb) Ebenfalls zu Recht hat das Patentgericht entschieden, dass es na- helag, die Zuordnung von Sprachdaten zu einer bestimmten Set-Top-Box mit Hilfe von Netzwerkadressen zu ermöglichen, wie dies aus dem ETS-Standard (NK16 Abschnitt 5.1.3, erster und zweiter Absatz) bekannt war. 6. Auch die Verteidigung mit Hilfsantrag 5 hat keinen Erfolg. a) Nach Hilfsantrag 5 soll Patentanspruch 1 in der Fassung des Hilfs- antrags 4 um folgende Merkmale ergänzt werden: 1.2.12 wherein that network comprises a content engine from which said speech recognition system receives content status infor- mation; wobei das Netzwerk eine Con- tent-Engine enthält, von der das Spracherkennungssystem In- haltsstatusinformationen erhält; 1.2.13 wherein the analog signals picked up by the microphone are pre-processed by the re- mote control. wobei die vom Mikrofon aufge- nommenen analogen Signale von der Fernsteuerung vorverarbeitet werden. 1.2.14 wherein the set top receives a radio frequency (RF) signal or an infra-red signal from the re- mote control. wobei die Set-Top-Box ein Radio- frequenzsignal oder ein Infrarot- signal von der Fernbedienung empfängt. 102 103 104 105 106 107 - 23 - b) Einige Merkmale bedürfen der Erläuterung. aa) Inhaltsstatusinformationen im Sinne von Merkmal 1.2.12 können zum Beispiel aus einer Liste von verfügbaren Diensten (Abs. 268, 336) oder aus einer Liste von verfügbaren Inhalten (Abs. 269, 316) bestehen. Als konkretes Bei- spiel nennt die Beschreibung einen interaktiven Programmführer (Abs. 269 Z. 51; Abs. 316 Z. 42). aa) Beispiele für eine Vorverarbeitung der analogen Mikrofonsignale (Merkmal 1.2.13) sind die Analog-Digital-Wandlung, die Verschlüsselung, Kom- pression oder Konversion in eine andere Sprachdatenrepräsentation (Abs. 64). c) Zutreffend hat das Patentgericht angenommen, dass Merkmal 1.2.12 durch NK9 nahegelegt war. aa) Mit dem Informationsverteilungszentrum und dem Headend sind in NK9 Content-Engines beschrieben, die Programmführerdaten verwalten und be- reitstellen. Nach den Ausführungen in NK9 sendet das Informationsverteilungszent- rum Informationen von einem oder mehreren Informationsanbietern an das End- gerät (Sp. 5 Z. 40-44). Diese Informationen enthalten Vokabeldaten (Sp. 5 Z. 59/60). Der Sprachprozessor im Endgerät führt einen Vergleich der Vokabel- daten und der gesprochenen Befehlsdaten durch, um beispielsweise Befehle zur Steuerung des Geräts oder Befehle für den Zugriff auf die von der Informations- verteilungszentrale übermittelten Informationen zu erkennen (Sp. 5 Z. 63 bis Sp. 6 Z. 3). Zusätzliche Vokabeldaten könnten von der Kopfstelleninstallation herun- tergeladen werden, um einem Benutzer zu ermöglichen, Befehle zu sprechen, indem er zusätzlich zu den Kanalnummern auch Kanalbezeichnungen verwendet (Sp. 28 Z. 50-53). NK9 beschreibt außerdem eine Titelsuche (Sp. 29 Z. 50 ff.) und eine Suche nach Schauspielern (Sp. 30 Z. 19-25). 108 109 110 111 112 113 114 - 24 - bb) Daraus ergab sich die Anregung, auch bei dem Spracherkennungs- system gemäß NK11 entsprechende Informationen bereitzustellen. d) NK9 offenbart unmittelbar und eindeutig eine Vorverarbeitung im Sinne des Merkmals 1.2.13 durch die Fernbedienung. Nach der Beschreibung in NK9 werden die analogen Sprachsignale in di- gitale Sprachsignale konvertiert und gegebenenfalls auch in eine spektrale Re- präsentation transformiert (Sp. 15 Z. 64 bis Sp. 16 Z. 2; Sp. 16 Z. 32-50, Figu- ren 5, 6, Blöcke 324 und 340). e) Da aus NK9 außerdem bekannt war, dass die Fernbedienung die Äußerungen eines Teilnehmers an das Endgerät in Form von Infrarot- oder Radiofrequenzsignalen übermittelt (Sp. 6 Z. 34-39; Sp. 12 Z. 23-26; Sp. 15 Z. 64 bis Sp. 16 Z. 5), lag auch die Kombination mit Merkmal 1.2.14 nahe. 7. Das Patentgericht hat zutreffend entschieden, dass auch der mit Hilfsantrag 6 verteidigte Gegenstand ausgehend von NK11 nahegelegt war. a) Nach Hilfsantrag 6 soll die erteilte Fassung von Patentanspruch 1 um folgende Merkmale ergänzt werden: 115 116 117 118 119 120 - 25 - 1.2.15 wherein the speech recognition system (3200, 1330) communi- cates with a content engine (1340), indicating a current user location in a menu struc- ture and/or a requested user action, in particular a video request; wobei das Spracherkennungssystem (3200, 1330) mit einer Content-En- gine (1340) kommuniziert und eine aktuelle Benutzerposition in einer Menüstruktur und/oder eine angefor- derte Benutzeraktion, insbesondere eine Videoanforderung, anzeigt; 1.2.16 and wherein the content en- gine (1340) provides at least one multimedia stream (1342) to a transceiver (1320) from which it is send to an individual user site. und wobei die Content-Engine (1340) mindestens einen Multimediastrom (1342) an einen Transceiver (1320) übermittelt, von dem er an einen indi- viduellen Teilnehmerstandort gesen- det wird. b) Einige Merkmale bedürfen der Erläuterung. aa) Das Patentgericht ist zutreffend davon ausgegangen, dass eine an- geforderte Benutzeraktion im Sinne des Merkmals 1.2.15 eine Handlung des Be- nutzers ist, zu der dieser aufgefordert worden ist, oder eine Anfrage, die der Be- nutzer angefordert hat, wie durch die Wörter "in particular a video request" zum Ausdruck kommt. bb) Merkmal 1.2.15 schließt nicht aus, dass das System mit mehr als einer Content-Engine kommuniziert. cc) Der Multimediastrom im Sinne des Merkmals 1.2.16 muss nicht zwingend ausschließlich an einen einzigen Teilnehmerstandort gesendet wer- den. Wie bei Merkmal 1.2.5 genügt es auch in diesem Zusammenhang, wenn der jeweils gesendete Multimediastrom der Anfrage des jeweiligen Benutzers entspricht. 121 122 123 124 125 126 - 26 - Weitergehende Anforderungen sind weder dem Wortlaut von Merk- mal 1.2.16 noch den darauf bezogenen Ausführungen in der Beschreibung zu entnehmen. c) Zutreffend hat das Patentgericht eine solche Ausgestaltung ausge- hend von NK11 als durch NK12 nahegelegt angesehen. aa) Ohne Erfolg macht die Berufung geltend, die Entgegenhaltung NK12 gehöre nicht zum Stand der Technik. Wie das Patentgericht in seinem Hinweis gemäß § 83 Abs. 1 PatG ausge- führt hat, ist die Veröffentlichung von NK12 vor dem Prioritätstag durch den Auf- druck "Vol. 38 No. 08 August 1995 IBM Technical Disclosure Bulletin" und durch die Wiedergabe dieser Angaben und des Titels des Beitrags im internationalen Recherchebericht der NK11 bewiesen. Dass NK12 im Recherchebericht des Streitpatents keine Erwähnung fin- det, obwohl das IBM Technical Disclosure Bulletin als durchsucht angegeben wurde, vermag vor diesem Hintergrund keine Zweifel an einer Veröffentlichung vor dem 27. April 2000 zu begründen. bb) NK12 beschreibt Methoden zur Verwendung von Spracherken- nung, um Fernsehbilder, Audiodaten und sonstige Daten auszuwählen oder zu verändern, die über ein Kabelfernsehsystem an einen Teilnehmer übertragen werden (S. 285, erster Satz unter Figur 1). Die durch das Spracherkennungssys- tem interpretierten Sprachbefehle stellen verschiedene Funktionen bereit, wie das Wechseln von Kanälen oder die Auswahl von Filmen zum Ansehen (S. 286 Abs. 1). cc) Ein Ausführungsbeispiel ist in der nachfolgend wiedergegebenen Figur 3 dargestellt. 127 128 129 130 131 132 133 - 27 - Bei dieser Ausführungsform sind der TV-Signal-Generator (29) und das Kabel-TV-System (30) netzwerkseitig angeordnet. dd) Der Sprachbefehl, mit dem bei dem in NK12 offenbarten System ein bestimmtes Video ausgewählt wird, ist eine Videoanforderung im Sinne des Merkmals 1.2.15. Da der TV-Signal-Generator (29) und das Kabel-TV-System (30) die ge- wünschten Inhalte bereitstellen, muss insoweit eine Kommunikation mit dem Spracherkennungssystem (28) erfolgen, in der die Auswahl des Videos ange- zeigt wird. ee) Dass auf die Anfrage an den TV-Signal-Generator (29) oder das Kabel-TV-System (30) mit dem Senden eines Multimediastroms an den anfor- dernden Teilnehmer reagiert wird, ist in NK12 zwar nicht ausdrücklich erwähnt, unterliegt aber schon deshalb keinem Zweifel, weil die Anforderung eines Videos auf dieses Ziel gerichtet ist. Nach den insoweit nicht beanstandeten Feststellungen des Patentgerichts geht die Verwendung eines Transceivers zu diesem Zweck nicht über eine fach- übliche Maßnahme hinaus. 134 135 136 137 138 - 28 - 8. Das Patentgericht hat den mit Hilfsantrag 7 verteidigten Gegen- stand zutreffend als ebenfalls nicht patentfähig angesehen. a) Nach Hilfsantrag 7 soll die erteilte Fassung von Patentanspruch 1 um folgendes Merkmal ergänzt werden: 1.2.17 Further comprising at least one of the steps of: determining said associated user site (1100) from said recognized speech content; determining said associated user site (1100) from said recognized speech content and a speaker identification library; determining said associated user site (1100) from said recognized speech content and a speech recognition library; and determining said associated user site (1100) from an identi- fication within said speech channel. Ferner umfasst es mindestens einen der folgenden Schritte: Bestimmen des zugeordneten Teil- nehmerstandorts (1100) aus dem er- kannten Sprachinhalt; Bestimmen des zugeordneten Teil- nehmerstandorts (1100) aus dem er- kannten Sprachinhalt und einer Spre- cheridentifikationsbibliothek; Bestimmen des zugeordneten Teil- nehmerstandorts (1100) aus dem er- kannten Sprachinhalt und einer Spracherkennungsbibliothek; und Bestimmen des zugeordneten Teil- nehmerstandorts (1100) aus einer Identifikation innerhalb des Sprach- kanals. b) Ausgehend von NK11 lagen der erste und der vierte der in Merkmal 1.2.17 vorgesehenen Schritte nahe. aa) Zu Recht hat das Patentgericht angenommen, dass es ausgehend von NK11 nahelag, die im Rahmen einer Teleshopping-Anwendung per Sprache übermittelte Versandadresse auch serverseitig einer Plausibilitätsprüfung zu un- terziehen. 139 140 141 142 143 - 29 - Entgegen der Auffassung der Berufung beziehen sich die Ausführungen des Patentgerichts nicht auf die in NK11 ausdrücklich vorgesehene Überprüfung der Adressdaten durch den Benutzer. Vielmehr geht es um eine zusätzliche Überprüfung auf dem Server. Dies entspricht dem ersten Schritt von Merk- mal 1.2.17. bb) Wie zu Hilfsantrag 4 ausgeführt wurde, lag es nahe, die übermittel- ten Sprachdaten durch die aus NK16 bekannten Netzwerkadressen zu kenn- zeichnen, um eine Zuordnung zur Set-Top-Box zu ermöglichen, die die Daten übermittelt hat. Dies entspricht dem vierten Schritt. 9. Mit Hilfsantrag 8 hat die Berufung ebenfalls keinen Erfolg. a) Hilfsantrag 8 entspricht Hilfsantrag 7 mit der Maßgabe, dass der letzte alternative Verfahrensschritt entfällt. b) Daraus ergibt sich im Vergleich zu Hilfsantrag 7 keine abweichende Beurteilung, da aus den oben angeführten Gründen auch der erste Schritt nahe- lag. 144 145 146 147 148 - 30 - IV. Die Kostenentscheidung beruht auf § 121 Abs. 2 PatG und § 97 Abs. 1 ZPO. Bacher Deichfuß Kober-Dehm Rombach Crummenerl Vorinstanz: Bundespatentgericht, Entscheidung vom 05.05.2022 - 2 Ni 68/20 (EP) - 149

Zitationsnetzwerk