Data Science là cái quần què gì?

Đã hẹn hò từ kỳ trước là kỳ này mình sẽ chia sẻ chút xíu về hành trình mình đến với Data Science có buồn vui tủi hờn thế nào, đạp chông gai ngắm hoa hồng ra sao 😆. Tuy nhiên, nghĩ lại thì trước khi đưa bà con đến với niềm vui nước mắt của 1 geek girl Data Science, thiết nghĩ chúng ta nên làm đoạn nhạc dạo về Data Science trước đã nhỉ 😋.

Bà con chắc hẳn có để ý mình để y xì cụm từ Data Science luôn không thèm dịch ra là Khoa học Dữ liệu nữa. Nghĩa là mình muốn tạo điều kiện cho mọi người tìm gặp bác Gú-gồ để dễ dàng đàm đạo thêm về Data Science nếu muốn í mà 😙.

Chính ra thì mình cũng chỉ mới tiếp cận và sử dụng thuật ngữ này để ám chỉ công việc và đam mê của mình trong vòng 2 năm trở lại đây thôi hà (cho dù là đã làm việc này 1 cách chính thức từ cách nay hơn 4 năm). Cũng phải thôi, ở Việt Nam, lĩnh vực này cũng còn khá mới, và hình như là chưa có trường đại học nào giảng dạy về nó hoặc nếu có thì cũng là đang thử nghiệm khoá đầu tiên. 

Và thường thì người ta hay nghĩ về Data Science như là 1 thứ gì đó cao siêu gắn với Trí thông minh Nhân tạo, với Dữ liệu lớn như là mấy ông bác nước ngoài như Gú-gồ hay Phây-búk. Ở VN mình thì đó là mấy ông như Tiki, Vịt-teo hay FPT đồ.

Người ta nghĩ rằng những người làm về Data Science phải rất rành lập trình, có khả năng viết thuật toán phá mã hoá thần sầu như mấy gã quái dị hay thấy trong mấy bộ phim phá án có liên quan đến CNTT của Mỹ (như bộ CSI Cyber í, mình coi ghiền luôn nè 😎)

Hoặc là người ta liên tưởng Data Science đến mấy cái ứng dụng, phần mềm, hay ngôn ngữ khủng như Java, SQL, Stata, Eviews, MatLab, R, hay Python (nếu bạn đọc tên mấy thứ này mà không thấy quen thuộc thì cũng đừng vội buồn, bản thân cái thằng chủ blog nó cũng chỉ biết được có 2, mấy thứ còn lại viết ra cho vui thôi 😜).

Và các công ty khi tuyển dụng nhân sự về Data Science thì thường đi kèm với các yêu cầu như là sáng tạo, tư duy logic tốt, tư duy phản biện tốt, có nền tảng về lập trình hoặc xác suất/thống kê, nhạy bén về kinh doanh, giao tiếp tốt (ồ men, mấy công ty ấy tuyển thánh tuyển thần chứ không tuyển người thì phải 😱 Cơ mà hình như đó là sự thật, ví dụ như là tin tuyển dụng của cái công ty toàn dị nhân quái thú www.rta.vn đây này)

Nói vậy hù nhau chơi thôi, chứ thực ra bà con cũng thường làm Data Science mà không hay không biết là mình cũng đang làm Data Science đó. Vì thực tế, Data Science gắn với quá trình thu thập - làm sạch - tinh chỉnh - trình diễn / truyền đạt dữ liệu một cách khoa học:
- Các cuộc hội thoại hằng ngày của chúng ta chính là quá trình áp dụng Data Science thu thập - xử lý - truyền đạt dữ liệu chính là các lời nói / từ ngữ.
- Các bảng biểu excel với các công thức IF, VLOOKUP, SUM, COUNT cũng chính là kết quả của Data Science.
- Các quyết định đi đường này không đi đường kia để tránh kẹt xe, mua cái này không mua cái kia để tránh xẹp ví, học cái này không học cái kia, đăng xì-ta-tút này mà không đăng còm-men nọ, tất thảy đều là kết quả từ Data Science mà ra.

Như vậy là chúng ta đều đang là các data scientist - các nhà khoa học dữ liệu cả đấy. Có khác chăng thì chính là cái hàm lượng KHOA HỌC trong mỗi quá trình xử lý DỮ LIỆU là ít hay nhiều mà thôi (hẳn nhiên rồi, tám chuyện về troai thì tốn ít chất xám hơn tám chuyện về Triết rồi 😉).

Vậy thì, bạn trẻ nào đang manh nha mong muốn dấn thân vào con đường Data Science thì đừng ngại hay sợ mình không đủ kiến thức, không đủ kỹ năng nhé. Chỉ đơn giản là bạn sẽ phải làm việc với NHIỀU DỮ LIỆU HƠN theo 1 cách KHOA HỌC HƠN (mà thực ra thì vì lười nên mới phải động não để cho máy xử lý thay mình cho phẻ đó mờ 😏)


Nhận xét

Đăng nhận xét