System Toucan Eye, który rozpozna w otoczeniu napisy czy symbole i przeczyta je osobom niedowidzącym, opracowują polscy innowatorzy. Do dyspozycji użytkownika będzie kamerka umieszczona w urządzeniu przypominającym słuchawkę bluetooth.
„W Polsce jest ok. 500 tys. osób niedowidzących. To osoby, które widzą kontury obiektów, ale nie widzą szczegółów” – mówi w rozmowie z PAP Radosław Zdunek z polskiej firmy Toucan Systems. Opowiada, że takie osoby zdane były dotąd na pomoc innych osób np. na przystanku, kiedy trzeba było rozpoznać numer zbliżającego się autobusu. Albo np. w urzędzie, kiedy szukały odpowiedniego okienka. Albo w restauracji czy sklepie, kiedy nie były w stanie samodzielnie zapoznać się z menu czy z ceną produktu. Nie mówiąc już o znalezieniu toalety.
Tymczasem nowe technologie dają takim osobom możliwość bycia niezależnymi od przypadkowych przechodniów. Firma Toucan Systems przy wsparciu z Narodowego Centrum Badań i Rozwoju pracuje nad systemem Toucan Eye. Pierwsze urządzenia polskiej firmy pojawić się mają na rynku pod koniec 2019 roku.
Czytaj także: Geostrategia, czas na radykalne zmiany
Urządzenie będzie wyglądać, jak słuchawka
„Użytkownik naszego urządzenia nie będzie się wyróżniać w tłumie” – opowiada Radosław Zdunek. Wyjaśnia, że urządzenie wyglądać będzie jak zwykła słuchawka bluetooth zakładana na ucho. Słuchawka ta jednak wyposażona będzie w niewidoczną na pierwszy rzut oka kamerkę. Połączona będzie bezprzewodowo z mobilnym komputerem wielkości smartfonu, który zmieści się w kieszeni czy torebce.
Tam algorytmy sztucznej inteligencji (AI) przeczesywać będą obraz z kamery w poszukiwaniu napisów i symboli, a odczytany napis przetworzą na ludzką mowę i prześlą informacje do słuchawki. Użytkownik będzie też mógł zawęzić obszar poszukiwań i wskazać gestem ręki obszar, w którym znajduje się interesujący go napis.
„Na początku wydawało nam się, że nasze urządzenie przyda się bardziej osobom niewidomym. Z konsultacji w Polskim Związku Niewidomych wynikło jednak, że bardziej naszym rozwiązaniem zainteresowane byłyby osoby niedowidzące, które – w porównaniu z osobami niewidomymi – znacznie rzadziej poruszają się w towarzystwie przewodnika” – opowiada Radosław Zdunek.
Toucan AI pracować będzie offline – wszystkie obliczenia będą wykonywane w przenośnym urządzeniu. Użytkownik nie będzie się więc musiał zastanawiać czy w miejscu, do którego idzie jest zasięg sieci komórkowej. A przy wyjeździe za granicę nie będzie musiał się martwić o wysokość rachunku za korzystanie z internetu. „Zależało nam na tym, by użytkownik mógł zawsze i wszędzie na Toucan AI polegać. Tak jak i na innych urządzeniach dla osób z dysfunkcjami” – mówi.
„Tylko jedna firma na świecie opracowała podobny system”
Radosław Zdunek wyjaśnia, że największym wyzwaniem w pracy nad urządzeniem jest opracowanie algorytmu, który napisy i symbole – np. oznaczenie toalety – rozpoznawać będzie w przeróżnych warunkach. „Problemem jest to, że w przestrzeni publicznej funkcjonuje wiele różnego rodzaju czcionek. Jedne są ozdobne, inne pochylone w lewo czy w prawo. Czasem litery ustawione w pionie – jedna pod drugą – inne pod skosem… W dodatku kamera widzieć je będzie pod różnym kątem i w różnych warunkach oświetleniowych. A w zapisie pojawiać się będzie szum. Odczytywanie takich napisów to złożony problem” – opowiada.
Początkowo urządzenie rozpoznawać ma napisy w języku polskim. Z czasem firma chce też wprowadzić wersję dla języka angielskiego.
„Dotąd tylko jedna firma na świecie opracowała podobny system. Będziemy z nią konkurowali w aspekcie skuteczności” – zapewnia Zdunek. Zapowiada, że polski produkt ma być tańszy i skuteczniejszy w rozpoznawaniu obiektów niż produkt dostępny już na rynku.
Twórcy Toucan Eye szacują, że jedno ładowanie powinno wystarczyć na osiem godzin ciągłej pracy ich urządzenia. Radosław Zdunek jednak zwraca uwagę: „Kiedy idziemy ulicą, nie interesują nas przecież wszystkie napisy, które mijamy. Użytkownik będzie więc włączał system w określonych miejscach” – opowiada innowator. Wciskając guziki na komputerku użytkownik przekaże więc urządzeniu, że potrzebuje pomocy i określi, w jakim typie scenerii się znajduje. Inny tryb pracy urządzenia będzie bowiem potrzebny w kawiarni, a inny – na przystanku autobusowym.
Dopiero kolejne wersje urządzenia będą w stanie same – analizując obraz – ustalić kontekst – czy to wnętrze (gdzie należy szukać małych literek w niedużej odległości od kamery), czy może otwarta przestrzeń (gdzie napisów szuka się daleko).
Źródło: Serwis Nauka w Polsce – www.naukawpolsce.pap.pl, Autorka: Ludwika Tomala