Lý do vì sao nhiều nhà khoa học dữ liệu đang dần bỏ việc
[Hay sự thất vọng của người trong nghề!]
— Jonny Brooks-Bartlett
[wall of text] tl;dr:
Làm DataScience cho các doanh nghiệp chỉ có kiến thức là chưa đủ mà phải xem định hướng của mình và họ có khớp không, biết chính trị công sở là thế nào,…
trans: dịch nhân lúc trường mình mở chuyên ngành Khoa học dữ liệu trong năm tới <(“)
(42k claps – 8 phút đọc)
— — — — — — — —
Vâng, tôi là một nhà khoa học dữ liệu và vâng, bạn đọc tiêu đề đúng rồi, nhưng vẫn phải có ai đó nói ra cơ. Chúng ta đã đọc rất nhiều bài viết nói rằng Khoa học dữ liệu (KHDL) là công việc hấp dẫn nhất thế kỷ 21 và khoản thù lao cao vợi của ngành này khiến nó tuyệt đối giống như một công việc trong mơ vậy. Điều chính yếu là lĩnh vực này bao gồm nhiều người với kỹ năng thượng thừa luôn si mê giải quyết những bài toán khó nhằn (“si mê” ý nói tích cực nhé). Có tất cả mọi thứ để yêu thích công việc này.
Nhưng sự thật là các nhà KHDL điển hình thường “dành ra 1 – 2 tiếng một tuần để tìm một công việc mới”, theo một bài viết của Financial Times. Hơn thế nữa, bài viết còn nói rằng “14,3% chuyên gia về Học máy đứng đầu danh sách các lập trình viên luôn muốn tìm công việc mới, theo sát là các nhà KHDL với con số 13,2%.” Những số liệu trên được thu thập bởi Stack Overflow trong một cuộc khảo sát với 64000 lập trình viên.
Tôi cũng từng ở trong tình thế đó và gần đây đã chuyển việc trong ngành KHDL.
Tại sao nhiều nhà KHDL tìm việc mới đến vậy?
Trước khi trả lời câu hỏi đó tôi phải khẳng định rằng tôi vẫn là nhà KHDL. Tổng thể mà nói, tôi yêu công việc này và không muốn làm nhụt chí bất kì ai đang khát khao trở thành nhà KHDL bởi nó rất vui, phấn khích và rất hậu hĩnh. Mục tiêu của bài viết này là thử nhập vai phản diện và phơi bày một số mặt tối của ngành.
Từ góc nhìn của tôi, có 4 lý do lớn khiến nhiều nhà KHDL thất vọng với công việc của họ.
1. Thực tế trái vế ước mong
“Ngành dữ liệu lớn (big data) giống như sex tuổi teen vậy: ai cũng nói về nó, chẳng ai thực sự biết phải làm thế nào, ai cũng nghĩ rằng những người khác đều làm cả, thế rồi tất cả bọn họ tuyên bố rằng họ đang làm…” — Dan Ariely
Câu trích dẫn này thật phù hợp. Nhiều tay mơ KHDL mà tôi biết (gồm cả tôi nữa) đều muốn bước vào ngành KHDL bởi nó hoàn toàn là giải quyết các vấn đề phức tạp có tác động to lớn lên cả một doanh nghiệp bằng những thuật toán học máy cool ngầu. Là cả một cơ hội để cảm thấy như chúng tôi đang làm một thứ quan trọng hơn bất kỳ thứ gì khác mình từng làm trước đó. Tuy nhiên, cơ may ấy thường không xảy ra đâu.
Theo tôi, thực tế trái vế ước mong là lý do cốt lõi khiến nhiều nhà KHDL bỏ việc. Có nhiều lý do viện dẫn đến lý do này, tuy tôi không thể liệt kê hết chúng ra nhưng bài viết này sẽ nêu lên một danh sách những lý do chủ yếu mà tôi đã gặp.
Mọi công ty đều khác biệt nên tôi không nói toàn bộ nhưng có nhiều công ty thuê các nhà KHDL mà không có đủ cơ sở hạ tầng phù hợp để có thể bắt đầu kiếm lợi từ trí tuệ nhân tạo (AI). Điều này góp phần lớn vào vấn đề khởi động lạnh trong AI (trans: nói một cách ví von rằng làm AI mà không có đủ cơ sở hạ tầng giống như khởi động xe khi máy của nó bị đông rồi vậy). Tựu chung với sự thật rằng những công ty này thất bại trong việc thuê được những tay làm KHDL kì cựu trước khi thuê mấy tay mơ, giờ đây bạn đã có công thức cho một mối quan hệ đổ vỡ và buồn tẻ giữa hai bên. Nhà KHDL có khả năng viết những thuật toán học máy thông minh đủ sức dẫn dắt tầm nhìn nhưng không thể hiện thực hóa được bởi công việc đầu tiên của họ lại là lựa chọn giữa cơ sở hạ tầng dữ liệu hay viết báo cáo phân tích. Phía công ty lại thấy bực bội bởi họ không thấy giá trị được dẫn dắt một cách đủ nhanh và tất cả điều này làm cho nhà KHDL trở nên không vui với vai trò của mình.
Robert Chang đã đưa ra một trích dẫn rất sâu sắc trong bài viết về lời khuyên cho tay mơ KHDL của mình:
Điều quan trọng là phải lượng giá được khát khao của bạn và định hướng cốt lõi của môi trường mà bạn làm việc khớp nhau đến mức nào. Hãy tìm những nhóm, những dự án và những công ty mà định hướng cốt lõi của họ khớp với nguyện vọng của bạn nhất.
Câu nói này làm nổi bật mối quan hệ song phương giữa nhà tuyển dụng và nhà KHDL. Nếu doanh nghiệp đó không phải nơi phù hợp hay có mục tiêu chệch hướng với nhà KHDL thì việc nhà KHDL tìm kiếm công việc mới chỉ còn là vấn đề thời gian.
Cho những ai quan tâm thì Samson Hu có một chuỗi bài viết đỉnh cao về cách mà nhóm phân tích được xây dựng ở Wish mà tôi thấy cũng sâu sắc không kém (trans: Wish là nền tảng thương mại điện tử với hơn 300 triệu người dùng)
Một lý do khác khiến các nhà KHDL vỡ mộng khá tương tự với cách mà tôi vỡ mộng về học thuật: tôi tin rằng tôi có thể tạo ra một tác động to lớn với mọi người ở khắp nơi, không chỉ trong công ty. Trong thực tế, nếu lĩnh vực kinh doanh trọng điểm của công ty không phải học máy (công ty cũ của tôi là một nhà phát hành đa phương tiện) thì chắc ăn là công việc KHDL mà bạn làm chỉ góp một phần nhỏ vào tăng trưởng chung mà thôi. Những điều này có thể thêm vào một thứ gì đó rất ý nghĩa hoặc là bạn may mắn rơi vào một phi vụ đào vàng nhưng mà cái đó hiếm lắm.
2. Chính trị trên đằng thượng đẳng
(trans: ý nói chính trị nơi công sở)
Có một bài viết tuyệt vời về vấn đề chính trị: Điều khó nhất trong khoa học dữ liệu: chính trị (The most difficult thing in data science: politics) mà tôi nghĩ bạn nên đọc ngay đi. Vài câu đầu từ bài viết bao hàm khá nhiều điều tôi muốn nói:
Khi tôi thức giấc vào lúc 6 giờ sáng để học Máy Vector Hỗ trợ (Support Vector Machine) tôi nghĩ: “Cái này khó vãi! Nhưng, này, ít nhất tao cũng sẽ trở nên rất giá trị cho người chủ tương lai của tao!”. Nếu tôi có chiếc DeLorean (trans: một cỗ máy du hành thời gian), tôi sẽ quay ngược thời gian và nói “Nhảm c*t!” với bản thân mình.
Nếu bạn nghiêm túc nghĩ rằng biết nhiều thuật toán học máy sẽ giúp bạn trở thành nhà KHDL có giá trị nhất thì hãy quay lại với quan điểm đầu tiên của tôi: thực tế trái vế ước mong.
Sự thật là những người làm trong những ngành kinh doanh có tầm ảnh hưởng lớn nhất cần phải có một cái nhìn tốt về bạn. Điều đó có nghĩa là bạn phải liên tục làm những việc có mục tiêu hạn hẹp như là lấy những con số từ cơ sở dữ liệu và gửi cho đúng người vào đúng thời điểm, làm những dự án đơn giản đến mức chỉ để đúng người có đúng cái nhìn về bạn. Tôi đã phải làm điều này rất nhiều lần ở chỗ cũ. Khó chịu là thế đấy, nhưng đó là một phần cần thiết của công việc.
3. Dữ liệu lịu địu vào thân
Đi cùng với việc phải làm bất cứ việc gì để làm hài lòng “đúng người”, chính những người đó với từng ấy tầm ảnh hưởng thường chẳng hiểu “nhà khoa học dữ liệu” là cái quái gì. Với danh xưng đó, bạn sẽ là chuyên gia phân tích kiêm tay báo cáo tài ba và đừng quên bạn cũng là chuyên gia cơ sở dữ liệu luôn.
Không chỉ những ông sếp không làm kĩ thuật hiểu rất sai lệch về kĩ năng của bạn mà các đồng nghiệp làm kĩ thuật cũng đinh ninh là bạn biết hết mọi thứ về dữ liệu. Như thể bạn phải biết hết Spark, Hadoop, Hive, Pig, SQL, Neo4J, MySQL, Python, R, Scala, TensorFlow, A/B Testing, NLP, bất kể thứ gì về học máy (và bất kể thứ gì liên quan đến dữ liệu mà bạn có thể nghĩ tới — nhân tiện, nếu bạn thấy một mô tả công việc nào ghi tất cả những thứ trên, hãy sáng suốt nhé. Có mùi chẳng lành khi một công ty viết mô tả công việc mà họ còn chẳng biết chiến lược dữ liệu của mình là gì và họ cứ thuê bất kì ai biết về dữ liệu vì họ nghĩ thế nào thì người đó cũng phải giải quyết mọi vấn đề dữ liệu mà họ gặp phải)
Nhưng nó không dừng lại tại đó. Bởi bạn biết hết mà và bạn chắc chắn có thể truy cập MỌI dữ liệu. Bạn là người được mong đợi sẽ trả lời được MỌI câu hỏi trong vòng……. chà, nên gửi cho người có liên quan từ 5 phút trước nhé.
Cố gắng làm mọi người hiểu điều bạn thực sự biết và có thể điều khiển được thường rất khó. Không phải vì ai cũng sẽ nghĩ về bạn ít một chút, mà là bằng tầm nhìn của một tay mơ KHDL với rất ít kinh nghiệm làm việc bạn sẽ lo sợ việc mọi người ít nghĩ về bạn hơn. Thật là một tình huống đau đầu.
4. Làm việc trong nhóm riêng biệt
Khi chúng ta thấy những sản phẩm dữ liệu thành công chúng ta thường thấy những giao diện bắt mắt với những tính năng thông minh và quan trọng nhất, một đầu ra hữu ích, mà ít nhất người dùng phải cảm thấy nó xử lý được vấn đề phù hợp với họ. Nếu một nhà KHDL chỉ dành thời gian để học cách viết và thực thi những thuật toán học máy, thì họ chỉ có thể là một phần nhỏ (mặc dầu cần thiết) của nhóm làm việc mà dẫn dắt sự thành công của một dự án tạo ra một sản phẩm có giá trị. Điều này có nghĩa là những nhóm KHDL làm việc một cách riêng biệt sẽ gặp nhiều khó khăn trong việc tạo ra giá trị!
Bất chấp điều đó, nhiều công ty vẫn có những nhóm KHDL được giao những dự án cho riêng họ rồi họ phải viết code để thử và giải quyết vấn đề. Trong một vài trường hợp, như thế là đủ. Ví dụ, nếu tất cả yêu cầu là đưa ra một trang tính tĩnh cho mỗi quý trong năm thì nó có thể cho một vài giá trị. Mặt khác, nếu mục đích là tối ưu hóa việc cung cấp các đề xuất thông minh trong một sản phẩm xây dựng trang web chuyên biệt, điều này cần nhiều kỹ năng khác nhau mà thường khó có thể trông đợi ở phần lớn các nhà KHDL được (chỉ có các kỳ lân KHDL mới làm được thôi). Nên nếu dự án đó được thực hiện bởi một nhóm KHDL tách biệt, khả năng cao là nó sẽ thất bại (hoặc ngốn rất nhiều thời gian bởi việc tổ chức những nhóm riêng biệt để hợp tác với nhau trong cùng một dự án ở các doanh nghiệp lớn không hề dễ dàng)
— — —
Vậy để thành một nhà KHDL có năng suất trong lĩnh vực công nghiệp, chỉ thi thố giỏi trên Kaggle và hoàn thành vài khóa học online là chưa đủ. Tái ông thất mã thế nào đấy nó liên quan nhiều tới việc hiểu cách hệ thống thứ bậc và chính trị công sở hoạt động trong lĩnh vực kinh doanh. Tìm được một doanh nghiệp khớp lệnh với định hướng cốt lõi của bản thân nên là mục tiêu chính khi tìm việc liên quan tới KHDL để thỏa mãn những nhu cầu của bạn. Tuy nhiên, có thể bạn cần phải điều chỉnh ước mong của mình một chút về vị trí làm KHDL.
Nếu ai có bình luận, câu hỏi hay phản biện nào, cứ tự nhiên comment bởi những cuộc tranh luận có tính xây dựng là cần thiết để giúp các nhà KHDL với đầy khát khao đưa ra những quyết định dày dạn hơn cho con đường sự nghiệp của họ.
Tôi hi vọng mình chưa làm tắt ngọn lửa trong bạn.
Cảm ơn đã đọc nhé 🙂
— — — — — — — —
trans: những cụm từ được gạch chân đều có đường dẫn trong bài viết gốc, nếu muốn tìm hiểu thêm hãy vào đó nhé 😡
Link medium: https://towardsdatascience.com/why-so-many-data-scientists-are-leaving-their-jobs-a1f0329d7ea4
#DataScience #KhoaHocDuLieu #Jobs #CongViec #OfficePolitics #ChinhTriCongSo #Advice #LoiKhuyen #TowardsDataScience