Machine Learning

Data Engineer

vnTokenizer trên PySpark

Trong blog này mình sẽ custom lại vn.vitk để có thể chạy như một thư viện lập trình, sử dụng ngôn ngữ python (trên PySpark và Jupyter Notebook).

vnTokenizer trên PySpark

Data

Chạy Apache Spark với Jupyter Notebook

IPython Notebook là một công cụ tiện lợi cho Python. Ta có thể Debug chương trình PySpark Line-by-line trên IPython Notebook một cách dễ dàng, tiết kiệm được nhiều thời gian.

Chạy Apache Spark với Jupyter Notebook

Chạy vnTokenizer trên môi trường Apache Spark

vnTokenizer là công cụ chuyên dùng tách từ, gán nhãn từ loại cho tiếng Việt, của tác giả Lê Hồng Phương. vnTokenizer được viết bằng Java, có thể sử dụng như Tools Command Line hoặc Programming.

Chạy vnTokenizer trên môi trường Apache Spark

Javascript

WebGazer.js - theo dõi chuyển động mắt của người dùng trên Website

WebGazer.js là thư viện viết bằng Javascript, theo dõi mắt người dùng, xác định điểm trên màn hình mà người dùng đang chú ý đến. Thư viện xử lý real-time, chạy trực tiếp trên trình duyệt, sử dụng webcam để nhận diện và không cần phải gửi video về server.

WebGazer.js - theo dõi chuyển động mắt của người dùng trên Website

Neural networks là gì?

Neural networks là gì?

Neural networks là gì?

Machine Learning

Japanese stopwords package for npm, bower and plaintext

Japanese stopwords, available for npm, bower, plaintext. 日本のストップワード

Japanese stopwords package for npm, bower and plaintext

News

13.5TB - Yahoo ra mắt bộ Dataset cực lớn cho lĩnh vực máy học

Yahoo Labs đã tung ra nhiều loại bộ dữ liệu khác nhau cho những ai nghiên cứu trong lĩnh vực máy học (Machine Learning). Các bộ dữ liệu này chủ yếu được thu thập từ các dịch vụ của Yahoo, như thông tin hoạt động người dùng, dữ liệu đồ thị, ảnh đã gán nhãn, ngôn ngữ tự nhiên, tin nhắn, tương tác mạng xã hội, tương tác tin tức ... từ Yahoo News, Yahoo Sports, Yahoo Finance, Yahoo Movies, ...

13.5TB - Yahoo ra mắt bộ Dataset cực lớn cho lĩnh vực máy học

Machine Learning

Tensorflow - cài đặt trên Docker

Docker luôn là giải pháp đóng gói và triển khai các ứng dụng 1 cách nhanh chóng và an toàn. Sau mình xin hướng dẫn các cài đặt Tensorflow trong môi trường container của Docker.

Tensorflow - cài đặt trên Docker