Nauka, Zdrowie i Rehabilitacja

Polski system przeczyta osobom niedowidzącym napisy z otoczenia

02.01.2019

System Toucan Eye, który rozpozna w otoczeniu napisy czy symbole i przeczyta je osobom niedowidzącym, opracowują polscy innowatorzy. Do dyspozycji użytkownika będzie kamerka umieszczona w urządzeniu przypominającym słuchawkę bluetooth.

– W Polsce jest ok. 500 tys. osób niedowidzących. To osoby, które widzą kontury obiektów, ale nie widzą szczegółów – mówi w rozmowie z PAP Radosław Zdunek z polskiej firmy Toucan Systems. Opowiada, że takie osoby zdane były dotąd na pomoc innych osób np. na przystanku, kiedy trzeba było rozpoznać numer zbliżającego się autobusu. Albo np. w urzędzie, kiedy szukały odpowiedniego okienka. Albo w restauracji czy sklepie, kiedy nie były w stanie samodzielnie zapoznać się z menu czy z ceną produktu. Nie mówiąc już o znalezieniu toalety.

Tymczasem nowe technologie dają takim osobom możliwość bycia niezależnymi od przypadkowych przechodniów. Firma Toucan Systems przy wsparciu z Narodowego Centrum Badań i Rozwoju pracuje nad systemem Toucan Eye. Pierwsze urządzenia polskiej firmy pojawić się mają na rynku pod koniec 2019 roku.

– Użytkownik naszego urządzenia nie będzie się wyróżniać w tłumie – opowiada Radosław Zdunek. Wyjaśnia, że urządzenie wyglądać będzie jak zwykła słuchawka bluetooth zakładana na ucho. Słuchawka ta jednak wyposażona będzie w niewidoczną na pierwszy rzut oka kamerkę. Połączona będzie bezprzewodowo z mobilnym komputerem wielkości smartfonu, który zmieści się w kieszeni czy torebce.

Tam algorytmy sztucznej inteligencji (AI) przeczesywać będą obraz z kamery w poszukiwaniu napisów i symboli, a odczytany napis przetworzą na ludzką mowę i prześlą informacje do słuchawki. Użytkownik będzie też mógł zawęzić obszar poszukiwań i wskazać gestem ręki obszar, w którym znajduje się interesujący go napis.

– Na początku wydawało nam się, że nasze urządzenie przyda się bardziej osobom niewidomym. Z konsultacji w Polskim Związku Niewidomych wynikło jednak, że bardziej naszym rozwiązaniem zainteresowane byłyby osoby niedowidzące, które – w porównaniu z osobami niewidomymi – znacznie rzadziej poruszają się w towarzystwie przewodnika – opowiada Radosław Zdunek.

Toucan AI pracować będzie offline – wszystkie obliczenia będą wykonywane w przenośnym urządzeniu. Użytkownik nie będzie się więc musiał zastanawiać czy w miejscu, do którego idzie jest zasięg sieci komórkowej. A przy wyjeździe za granicę nie będzie musiał się martwić o wysokość rachunku za korzystanie z internetu. – Zależało nam na tym, by użytkownik mógł zawsze i wszędzie na Toucan AI polegać. Tak jak i na innych urządzeniach dla osób z dysfunkcjami – mówi.

Radosław Zdunek wyjaśnia, że największym wyzwaniem w pracy nad urządzeniem jest opracowanie algorytmu, który napisy i symbole – np. oznaczenie toalety – rozpoznawać będzie w przeróżnych warunkach. – Problemem jest to, że w przestrzeni publicznej funkcjonuje wiele różnego rodzaju czcionek. Jedne są ozdobne, inne pochylone w lewo czy w prawo. Czasem litery ustawione w pionie – jedna pod drugą – inne pod skosem… W dodatku kamera widzieć je będzie pod różnym kątem i w różnych warunkach oświetleniowych. A w zapisie pojawiać się będzie szum. Odczytywanie takich napisów to złożony problem – opowiada.

Początkowo urządzenie rozpoznawać ma napisy w języku polskim. Z czasem firma chce też wprowadzić wersję dla języka angielskiego.

– Dotąd tylko jedna firma na świecie opracowała podobny system. Będziemy z nią konkurowali w aspekcie skuteczności – zapewnia Zdunek. Zapowiada, że polski produkt ma być tańszy i skuteczniejszy w rozpoznawaniu obiektów niż produkt dostępny już na rynku.

Twórcy Toucan Eye szacują, że jedno ładowanie powinno wystarczyć na osiem godzin ciągłej pracy ich urządzenia. Radosław Zdunek jednak zwraca uwagę: – Kiedy idziemy ulicą, nie interesują nas przecież wszystkie napisy, które mijamy. Użytkownik będzie więc włączał system w określonych miejscach – opowiada innowator. Wciskając guziki na komputerku użytkownik przekaże więc urządzeniu, że potrzebuje pomocy i określi, w jakim typie scenerii się znajduje. Inny tryb pracy urządzenia będzie bowiem potrzebny w kawiarni, a inny – na przystanku autobusowym.

Dopiero kolejne wersje urządzenia będą w stanie same – analizując obraz – ustalić kontekst – czy to wnętrze (gdzie należy szukać małych literek w niedużej odległości od kamery), czy może otwarta przestrzeń (gdzie napisów szuka się daleko). (PAP)

Ludwika Tomala, fot. pixabay.com

Data publikacji: 02.01.2019 r.