Câu hỏi phỏng vấn về Khoa học dữ liệu của Google: Tất cả những gì bạn cần biết để bẻ khóa nó

Bài viết này cung cấp cho bạn một loạt câu hỏi phỏng vấn về Khoa học dữ liệu của Google, Quy trình phỏng vấn và các điều kiện tiên quyết để nộp đơn xin việc tại Google.

Được tuyển dụng trong một Công ty Nổi tiếng Toàn cầu như Google là Công việc trong mơ đối với rất nhiều người. Họ có một số Nhà khoa học Nghiên cứu AI tài năng nhất, và trên thế giới. Không có nhiều nguồn cho Google Câu hỏi phỏng vấn trực tuyến và không dễ kiếm được việc làm ở đó. Vì vậy, tôi sẽ đề cập đến các chủ đề sau trong bài viết này:



Mô tả công việc và yêu cầu

Với mức lương trung bình là $ 169.067 , bao gồm cả tiền thưởng. Mức lương của Nhà khoa học dữ liệu của Google dao động từ 120.000 USD - 280.000 USD . Với mức lương cao này, bạn cần biết yêu cầu phù hợp với Công việc mà bạn đang ứng tuyển. Mặc dù các yêu cầu khác nhau giữa các vị trí, Dưới đây là một số yêu cầu phổ biến:

Yêu cầu tối thiểu:



google

  • Bằng Thạc sĩ về Kỷ luật Định lượng (Thống kê, Nghiên cứu Hoạt động, Khoa học Máy tính)
  • 2 năm kinh nghiệm làm việc trong lĩnh vực liên quan đến Phân tích dữ liệu
  • Có kinh nghiệm với phần mềm thống kê (ví dụ: R , , MATLAB, Pandas) và
  • Có kinh nghiệm với các ngôn ngữ cơ sở dữ liệu (ví dụ: SQL )

Trách nhiệm:



  • Làm việc với các tập dữ liệu lớn, phức tạp. Giải quyết các vấn đề phân tích khó, không theo quy trình, áp dụng các phương pháp phân tích tiên tiến khi cần
  • Tiến hành phân tích bao gồm thu thập dữ liệu và đặc tả yêu cầu, xử lý, phân tích, phân phối liên tục và trình bày
  • Xây dựng và tạo mẫu đường ống phân tích lặp đi lặp lại để cung cấp thông tin chi tiết trên quy mô
  • Phát triển kiến ​​thức toàn diện về cấu trúc dữ liệu và chỉ số của Google, ủng hộ những thay đổi cần thiết để phát triển sản phẩm
  • Tương tác đa chức năng, đưa ra các đề xuất kinh doanh (ví dụ: chi phí-lợi ích, dự báo, phân tích thử nghiệm)
  • Nghiên cứu và phát triển các phương pháp phân tích, dự báo và tối ưu hóa để cải thiện chất lượng các sản phẩm hướng đến người dùng của Google

Quy trình Phỏng vấn Khoa học Dữ liệu của Google

Xóa danh sách rút gọn bản thân nó là một nhiệm vụ khó khăn, điều này hoàn toàn phụ thuộc vào CV, Thư xin việcKinh nghiệm . Google Khoa học dữ liệu Câu hỏi phỏng vấn là sự kết hợp của các câu hỏi trêu ghẹo não và câu hỏi kỹ thuật. Thông thường, quy trình đầu tiên là Phỏng vấn qua điện thoại.

Phỏng vấn qua điện thoại:

Nó bao gồm các câu hỏi chủ yếu dựa trên (cụ thể và lý thuyết) và dựa nhiều vào . Các câu hỏi cũng khác nhau dựa trên các dự án bạn đã làm việc.
  • Trường hợp 1: Các cuộc phỏng vấn đã hỏi về các kỹ thuật trích xuất tính năng, PCA (Được sử dụng trong các dự án), phân tích tương quan, một số kỹ thuật phân loại đã được sử dụng (SVM, GBM, neural net). Tại sao không hồi quy logistic, tại sao lại là GBM? - Về cơ bản các câu hỏi xoay quanh khả năng tách lớp.
  • Trường hợp 2: Tại sao sử dụng lựa chọn tính năng? Nếu hai yếu tố dự báo có tương quan cao, thì ảnh hưởng của các hệ số trong hồi quy logistic là gì? Khoảng tin cậy của các hệ số là gì?
  • Trường hợp 3: Đĩa đang quay trên trục quay và bạn không biết hướng quay của đĩa. Bạn được cung cấp một bộ ghim. Làm thế nào bạn sẽ sử dụng các ghim để mô tả cách mà đĩa đang quay?
Sau Phỏng vấn qua điện thoại, đó là Vòng đối mặt và Vòng mã hóa. Vì vậy, Hãy cùng Thảo luận về một số Câu hỏi Phỏng vấn Khoa học Dữ liệu của Google phổ biến nhất. Mặc dù những câu hỏi này có thể không được hỏi chính xác như được đưa ra bên dưới, nhưng tôi đã cố gắng giải đáp rất nhiều trong số chúng.

Câu hỏi phỏng vấn về Khoa học Dữ liệu của Google

Những câu hỏi này không phải là câu đố, vì Google đã ngừng hỏi những câu hỏi đó thay vào đó, họ có những câu hỏi tương tự mà họ gọi là Câu hỏi giải quyết vấn đề . Rất nhiều câu hỏi về Học máy, từ tất cả các cách từ chung chung đến thực tế được hỏi. Google về cơ bản bao gồm chiều rộng của các chủ đề hơn là Chiều sâu. Q1. Bạn đang ở một Sòng bạc và có hai con xúc xắc để chơi cùng. Bạn thắng 10 đô la mỗi khi quay số 5. ​​Nếu bạn chơi cho đến khi thắng và sau đó dừng lại, khoản thanh toán dự kiến ​​là bao nhiêu? Quý 2. Bạn chuẩn bị lên máy bay đến London, bạn muốn biết mình có phải mang ô hay không. Bạn gọi cho ba người bạn ngẫu nhiên của mình và gọi cho từng người trong số họ nếu trời mưa. Xác suất bạn của bạn nói thật là 2/3 và xác suất họ đang chơi khăm bạn bằng cách nói dối là 1/3. Nếu cả 3 người trong số họ nói rằng trời đang mưa, thì xác suất để trời thực sự mưa ở Luân Đôn là bao nhiêu. Q3. Làm thế nào sẽ thêm mới Facebook thành viên vào cơ sở dữ liệu của các thành viên, và mã mối quan hệ của họ với những người khác trong cơ sở dữ liệu? Q4. Làm thế nào bạn sẽ kiểm tra xem có tăng xác suất người dùng tiếp tục hoạt động sau 6 tháng khi người dùng hiện có nhiều bạn bè hơn không? Q5. Bạn được phát 40 thẻ với bốn màu khác nhau - 10 thẻ Xanh, 10 thẻ Đỏ, 10 thẻ Xanh và 10 thẻ Vàng. Các thẻ của mỗi màu được đánh số từ một đến mười. Hai thẻ được chọn ngẫu nhiên. Tìm xác suất để các thẻ được chọn không cùng số và cùng màu. Q6. Tạo một chương trình bằng ngôn ngữ bạn chọn để đọc một tệp văn bản với nhiều dòng tweet khác nhau. Đầu ra phải là 2 tệp văn bản-một tệp chứa danh sách tất cả các từ duy nhất trong số tất cả các tweet cùng với số lượng các từ được lặp lại và tệp thứ hai phải chứa số lượng trung bình các từ duy nhất cho tất cả các tweet. Q7. Bạn sẽ làm gì nếu việc xóa các giá trị bị thiếu khỏi tập dữ liệu gây ra sai lệch? Q8. Đĩa đang quay trên trục quay và bạn không biết hướng quay của đĩa. Bạn được cung cấp một bộ ghim. Làm thế nào bạn sẽ sử dụng các ghim để mô tả cách mà đĩa đang quay? Q9. Bạn sẽ thiết kế một công cụ giới thiệu việc làm như thế nào? Q. 10. Bạn muốn xây dựng loại sản phẩm nào tại Google? Q11. Ô tô được cấy thiết bị theo dõi tốc độ để các công ty bảo hiểm có thể theo dõi trạng thái lái xe của chúng ta. Dựa trên sơ đồ mới này, loại câu hỏi kinh doanh nào có thể được trả lời? Q12. Làm thế nào bạn có thể quyết định xem một thuật toán có tốt hơn thuật toán kia hay không? Q13. Một hộp có 12 thẻ đỏ và 12 thẻ đen. Một hộp khác có 24 thẻ đỏ và 24 thẻ đen. Bạn muốn rút ngẫu nhiên hai thẻ từ một trong hai hộp, hộp nào có xác suất lấy được thẻ cùng màu cao hơn và tại sao? Q14. Sự khác biệt giữa mô hình có túi và mô hình tăng cường là gì? Q15. Bạn đang tạo báo cáo về lượt tải lên nội dung của người dùng hàng tháng và nhận thấy số lượt tải lên đột ngột trong tháng 1. Số lượt tải lên tăng lên, đặc biệt là ở lượt tải lên hình ảnh. Bạn nghĩ đâu sẽ là nguyên nhân của điều này và bạn sẽ kiểm tra mức tăng đột biến này như thế nào? Q16. Bạn đang sở hữu một doanh nghiệp quần áo và muốn nâng cao vị thế của mình trên thị trường. Làm thế nào bạn sẽ làm điều đó từ cấp độ mặt đất? Q17. Làm thế nào bạn sẽ quyết định phiên bản nào của hai trong số các Thuật toán định giá đột biến đang hoạt động tốt hơn cho bất kỳ Công ty Hàng không nào? Q18. Mức độ tự do cho lasso là gì? Q19. Sự khác biệt giữa trình lặp, trình tạo và khả năng hiểu danh sách trong Python là gì? Q20. Với một tập hợp các trang web và các thay đổi trên trang web, bạn sẽ kiểm tra tính năng trang web mới như thế nào để xác định xem thay đổi có hoạt động tích cực hay không? Q21. Cho một ma trận kích thước MxN với mỗi ô chứa một bảng chữ cái, hãy tìm xem có chứa một chuỗi trong đó hay không. Q22. Bạn sẽ xây dựng hệ thống bộ nhớ đệm bằng cách sử dụng cấu trúc dữ liệu nâng cao như hashmap như thế nào? Q23. Nếu bạn có thể nhận được tập dữ liệu về bất kỳ chủ đề quan tâm nào, bất kể phương pháp thu thập hoặc tài nguyên thì tập dữ liệu sẽ trông như thế nào và bạn sẽ làm gì với nó? Q24. Các phương pháp phát hiện dị thường là gì? Q25. Bộ nhớ đệm hoạt động như thế nào và bạn sử dụng nó như thế nào trong Khoa học dữ liệu? Vì vậy, các bạn, chúng ta kết thúc bài viết này. Các câu hỏi phỏng vấn về Khoa học Dữ liệu của Google chủ yếu là dựa trên kịch bản và yêu cầu bạn phải có Khả năng giải quyết vấn đề và hơn thế nữa bạn cần biết cách áp dụng Khoa học dữ liệu vào những tình huống này. Tôi hy vọng điều này sẽ cung cấp cho bạn một góc nhìn để chuẩn bị cho bất kỳ cuộc Phỏng vấn Khoa học Dữ liệu nào trong tương lai. Có thể là Google, Microsoft, Apple hoặc Uber. Tất cả những người khổng lồ về công nghệ đều hỏi những loại Câu hỏi tương tự khi nói đến Khoa học dữ liệu vì nó là một lĩnh vực rộng lớn và đồng thời là một lĩnh vực mới. giúp bạn thành thạo các công cụ và hệ thống được các Chuyên gia Khoa học Dữ liệu sử dụng. Nó bao gồm đào tạo về Thống kê, Khoa học Dữ liệu, Python, Apache Spark & ​​Scala, Tensorflow và Tableau. Chương trình học đã được xác định bằng nghiên cứu sâu rộng về hơn 5000 mô tả công việc trên toàn cầu. Nếu bạn có bất kỳ thắc mắc nào, đừng ngại đề cập trong phần bình luận bên dưới.