Trang chủ / works / AI & IoT / Nghiên cứu ứng dụng công nghệ nhận dạng hình ảnh thời gian thực

Nghiên cứu ứng dụng công nghệ nhận dạng hình ảnh thời gian thực

Nghiên cứu ứng dụng công nghệ nhận dạng hình ảnh thời gian thực
data
Nội dung

ONETECH đã nghiên cứu và phát triển các ứng dụng nhận dạng hình ảnh thời gian thực với OpenCV + AI Yolo. Lần này, chúng tôi sẽ giới thiệu 3 kết quả nghiên cứu và ứng dụng vào thực tiễn để trình bày cho các buổi hội thảo giới thiệu công nghệ của công ty vào năm 2018.

  1. Ứng dụng phiếu giảm giá AR tại các nhà hàng với OpenCV + AI Yolo
  2. Ứng dụng AR nhận dạng biển báo giao thông OpenCV + AI Yolo
  3. Nhận dạng hình ảnh thương hiệu cà phê lon OpenCV + AI Yolo

Nhận dạng hình ảnh với AI (trí tuệ nhân tạo)

YOLO là một thư viện nhận dạng hình ảnh giúp phân tích và phát hiện các đối tượng từ các hình ảnh tĩnh được cung cấp. YOLO từ viết tắt của “You Only Look Once”, được cộng đồng developer trên thế giới đánh giá là thư viên AI mạnh mẽ với khã năng phát hiện và nhận dạng nhiều đối tượng trong một hình ảnh bằng cách truyền hình ảnh qua CNN (Convolutional Neural Network: Mạng lưới thần kinh chuyển đổi) một lần duy nhất. Đây là ứng dụng về trí tuệ nhân tạo học máy (Machine learning và học sâu (Deep learning).

ONETECHは、ベトナムオフショアロボット操作シミュレーションアプリ開発
ONETECH luôn đầu tư mạnh mẽ trong nghiên cứu phát triển các công nghệ và kỹ thuật tiên tiến nhất

YOLO cũng có một thư viện phát hiện đối tượng C / C ++ được gọi là DARKNET, nhưng lần này chúng tôi đã triển khai nó với sự kết hợp của OpenCV và YOLO. OpenCV là một thư viện mã nguồn mở ban đầu được phát triển và xuất bản bởi Intel có các chức năng như xử lý hình ảnh, phân tích hình ảnh và học máy . Nó được mở công khai cho Python, C / C ++, Java và MATLAB.

Xử lý hình ảnh với OpenCV

OpenCV là một thư viện các chức năng lập trình chủ yếu nhắm vào thị giác máy tính thời gian thực. Ban đầu được phát triển bởi Intel, sau đó nó được hỗ trợ bởi Willow Garage sau đó là Itseez. Thư viện đa nền tảng và được sử dụng miễn phí theo Giấy phép Apache 2 nguồn mở.

Đối với các công nghệ hiện đại, OpenCV cũng là một yếu tố không thể thiếu. Tất cả những ứng dụng công nghệ như robot, xe tự lái, bảng cảm ứng thông minh… đều có sự góp mặt của OpenCV trong khâu xử lý hình ảnh. Ví dụ gần gũi nhất trong cuộc sống có thể kể đến hệ thống mở khóa điện thoại bằng cách nhận diện khuôn mặt người dùng.

OpenCV sở hữu giao diện thiên thiện với mọi loại ngôn ngữ lập trình, ví dụ như C++, C, Python hay Java… Ngoài ra, nó cũng dễ dàng tương thích với các hệ điều hành khác nhau, bao gồm từ Windows, Linux, Mac OS, iOS cho đến cả Android.

Nghiên cứu ứng dụng công nghệ nhận dạng hình ảnh thời gian thực

ONETECH đã tiến hành nghiên cứu và phát triển các ứng dụng với OpenCV và YOLO mà cụ thể là công nghệ nhận dạng hình ảnh theo thời gian thực. Xin được giới thiệu 3 kết quả nghiên cứu và ứng dụng vào thực tiễn sau đây:

Ứng dụng phiếu giảm giá AR tại các nhà hàng

Người dùng sử dụng camera điện thoại để quét bảng hiệu của cửa hàng ăn nhanh của chúng tôi và kết quả sẽ hiển thị các phiếu giảm giá và liên kết tới trang web để sử dụng!

https://www.youtube.com/watch?v=qedx6o4gvfA
Video demo ứng dụng quét bảng hiệu nhận phiếu giảm giá AR và truy cập Fanpage cửa hàng (ONETECH)

Sự khác biệt so với các ứng dụng phiếu giảm giá khác là nó chạy trên AI Yolo + OpenCV thay vì đọc báo hiệu và điểm đánh dấu. Công nghệ học sâu với AI Yolo sử dụng khoảng 50 dữ liệu hình ảnh của cửa hàng nhỏ của chúng tôi làm dữ liệu huấn luyện. Ứng dụng hoạt động tốt ngay cả khi xung quanh thiếu sáng.

Trong tương lai, chúng tôi nâng cấp phát triển nhằm tăng khả năng nhận diện bằng cách sẽ gửi nhiều ảnh từ ứng dụng đến máy chủ làm dữ liệu đào tạo, xử lý chúng với AI Yolo bằng cách học sâu, chỉ lưu trữ logic AI trong ứng dụng và cho phép hiển thị nhiều phiếu giảm giá với các trường hợp khác nhau.

Ứng dụng AR nhận dạng biển báo giao thông

Ứng dụng chạy trên camera của iPhone cho phép tự động nhận dạng các loại biển báo giao thông ngoài đường dưới dạng hình ảnh thu được từ camera. Ý nghĩa của các biển báo giao thông sẽ được hiển thị tăng cường trong AR với các chỉ dẫn rõ ràng và chi tiết hơn.

https://www.youtube.com/watch?v=HJlYXgZIdYo
Video demo ứng dụng nhận diện bảng hiệu giao thông và hiển thị thông tin tăng cường AR (ONETECH)

Trong khi vẫn đang lái xe, tôi có thể đọc rõ các biển hiệu với độ chính xác đáng kể ngay cả khi điều kiện ánh sáng kém.

Khi người nước ngoài sống ở một quốc gia khác, họ thường không hiểu ý nghĩa của các biển báo khi lái xe. Bạn có thể đi bất cứ đâu với giải pháp này. Chúng tôi cũng hỗ trợ dịch thuật đa ngôn ngữ.
Được phát triển bằng cách tùy chỉnh AI Yolo + OpenCV. Có thể nhận dạng hình ảnh nâng cao đầy đủ ngay cả với máy ảnh của điện thoại thông minh.

Nhận diện hình ảnh thương hiệu trên các chai nước

Dữ liệu về một số thương hiệu nước đóng chai đã được lưu trữ trong ứng dụng để làm dữ liệu học máy như logo, màu sắc, bố cục…

https://www.youtube.com/watch?v=IIaMjalj6qI
Video demo ứng dụng nhận diện hình ảnh thương hiệu trên các chai nước (ONETECH)

Camera khi quét các chai nước này, ứng dụng có thể dễ dàng nhân được được thương hiệu và hiển thị các thông tin bổ sung giới thiệu về sản phẩm như tên sản phẩm, giá bán và liên kết tới trang mua hàng online.

Tổng kết

ONETECH là chuyên phát triển các ứng dụng khác nhau ở Việt Nam. Đặc biệt, chúng tôi đang tập trung vào lĩnh vực XR (VR/AR/MR), nhận dạng hình ảnh và AI.& IoT. Chúng tôi luôn đẩy mạnh nghiên cứu phát triển các ứng dụng công nghệ mới nhất và đưa ra những giải pháp đề xuất phù hợp cho khách hàng của chúng tôi. Công nghệ tiên tiến giúp giải quyết nhiều vấn đề thực tiễn về kinh doanh cũng như sản xuất giúp khách hàng của chúng tôi tăng hiệu suất và tiếc kiệm chi phí.

株式会社one technology japan
Đội ngũ kỹ sư trẻ, năng động và yêu thích công nghệ tại ONETECH

Chúng tôi cũng sẵn sàng thiết lập các nhóm nghiên cứu hoặc phòng Lab riêng cho khách hàng đồng thời cung cấp nguồn nhân lực để triển khai các ý tưởng của khách hàng ngay tại văn phòng của chúng tôi. Điều này giúp giảm nhiều thời gian, chi phí cũng như các rủi ro khi tự triển khai.

Nếu bạn đang quan tâm phát triển các ứng dụng công nghệ mới, hãy liên hệ ngay với ONETECH nhé!

RELATED

Khách hàng sử dụng HoloLens và khởi chạy ứng dụng để bắt đầu quét và nhận dạng các bộ phận của thiết bị máy móc trong thực tế. Các thông tin kỹ thuật sẽ được hiển thị trong không gian dưới dạng mô hình 3D ngay trên đối tượng. 

ONETECH phát triển mô-đun ứng dụng OCR tự động phân tích các số trong khung hiển thị của màn hình led phổ biến, sử dụng phương pháp công cụ đo cường độ sáng và SSOCR.

OneTech bắt đầu thực hiện nhiều nhiệm vụ khác nhau để tìm hiểu và phát triển các ứng dụng cho Robot Pepper của Softbank. Dưới đây là công trình nghiên cứu và phát triển một ứng dụng trò chuyện nhận dạng giọng nói thông qua AI.

liên hệ