Hỏi - đáp Nơi cung cấp thông tin nghề nghiệp và giải đáp những thắc mắc thường gặp của bạn

Tuyển tập một số câu hỏi phỏng vấn cho dân AI Engineer

Bài viết này TMA đã soạn ra một số câu hỏi tiêu biểu mà người phỏng vấn thường hỏi các bạn ứng tuyển vị trí AI Engineer. Bài viết này có thể chưa đầy đủ nhưng hy vọng vài mánh khóe này sẽ giúp các bạn trong quá trình phỏng vấn được thuận lợi hơn. Nếu các bạn có thắc mắc thêm về các câu hỏi khác thì thoải mái liên hệ tâm sự với TMA nhé.

1./  y = ax + b có mấy nghiệm

Ans: y = ax + b có vô số nghiệm

2./ Nhược điểm lớn nhất của linear regession

Ans: Nhược điểm lớn nhất của linear regession là rất nhạy cảm với nhiễu

3./ Relu có ưu điểm gì,thay = sigmoid có dc ko

Ans: 
a. Ưu điểm của Relu là giảm chi phí tính toán và hạn chế vanishing gradient. Về bản chất tính toán có thể thay sigmoid bằng gradient cả nhưng thực tế ta không nên làm điều này bởi vì ta biết đạo hàm của sigmoid nhỏ hơn 1 nên khi dùng sigmoid thì rất dễ xảy ra vanishing gradient
b.Tính thưa thớt (sparsity): Hàm ReLU chỉ active các neural khi giá trị của neural >0. Vì vậy nó sẽ tạo ra tính thưa thớt (chỉ một số neural được active) cho các neural so với hàm sigmoid. Tính thưa thớt tạo ra khả năng phân loại tốt hơn cho neural network.

4./ Matrix giả nghịch đảo để làm gì

Ans:
Matrix giả nghịch đảo dùng để tìm matrix nghịch đảo khi khi mà trận là không khả nghịch (điịnh thức =0) ,hoặc không vuông.

5./ Làm sao tìm dc global mininum khi có nhiều local minimum.

Ans: Muốn tìm global minimun khi có nhiều local thì phải thêm tính năng vượt qua local minimun cho giải thuật train. Ví dụ như dung momentum để vượt qua local minimun là một cách. Thêm vào đó, tTa ko cố gắng tìm ra global minium vì rất chi phí tính toán rất lớn, mà cố gắng tìm local minium nào gần nhất global mà ta có thể chấp nhận dc thôi.

6./ Kiểm định chi square dùng để làm gì,nguồn gốc của phân phối chi square

Asw: Trong ML người ta dùng chi-square để chọn feature quan trọng trên dataset.
Phân phối chi square nó bắt nguồn từ phân phối Z. Nó bằng tổng bình phương của k phân phối z( k là bậc tự do).

7./ P value là gì, giá trị bao nhiêu là tốt(cho con số cụ thể)

Ans: Trị số p (p-values) là một con số xác suất, tức là viết tắt chữ "probability values", cho biết giá trị kiểm định của chúng ta có đủ bằng chứng để kết luận chấp nhận hay bác bỏ giả thuyết (null hypothesis) ban đầu hay không. P value < 0.05 có bằng chứng mạnh bác bỏ giả thiết Ho

8./ Khi dùng CNN làm sao biết nên dùng bao nhiêu layer?

Ans: Ta sẽ dựa vào kinh nghiệm của bản thân và kinh nghiệm của nhưng người đi trước trên những dữ liệu tương tự để quyết định nên dùng bao nhiêu layer. Ta nên tham khảo những bài toán tương tự của chúng ta mà người khác đã làm rồi để xem họ cấu trúc họ dùng các layer ra sao sau đó áp dụng vào bài toán của mình. Cuối cùng là phải thay đổi số layer để chạy thử trên dự liệu của mình để tìm ra số layer và cấu trúc mạng tối ưu.

9./ Khi loss function nó giảm nhưng lâu lâu lại tăng đột ngột(chắc nhìn hình dễ hình dung hơn) thì xảy ra hiên tượng gì. Cách khắc phục.

Ans: Hiện tượng này có thể do có nhiều local minimun nên loss lâu lâu lại tăng. Tuy nhiên nhìn tổng thể thì loss vẫn giảm chứng tỏ giải thuật train có khả năng vượt qua local minimun nên có lẽ không cần cách khắc phục.
[Bonus]: Nếu như loss bị tăng giảm thất thường thì có thể là do learning rate quá lớn. Cách khắc phục là cho learning rate nhỏ lại thì sẽ không bị tăng giảm thất thường nữa mà sẽ giảm đều.

Bài viết tổng hợp nhiều nguồn.