百度面試演算法

發布時間: 2022-06-22 21:30:08

A. Seo面試中被問到關於百度演算法應該怎麼解釋

關於網路演算法問題：

網路17年推出很多演算法，目的就是把規則完善的更全，使得大環境更加公平些，懲罰那些通過作弊手段去做優化的不良行為。
沒有逾越規則，正規方式做優化也沒必要去過度擔心演算法的懲罰，但是對於演算法要了解。
seo優化需要研究網站內部結構，網路收錄的規則，排名規則，穩定排名的規則，這樣才能保證網站優化出效果。

B. 老生常談：面試演算法有必要嗎

首先，面試什麼東西不是被面試者決定的，而是面試者決定的。

其次，編程，本質上是用計算機解決問題，而經過多年業界總結出來的經典演算法，就是針對經典而典型問題的解決方案，學習這些演算法，除了能夠解決這些典型問題之外還能夠掌握解決問題的能力，從而觸類旁通。所以說，面試演算法是考察被面試者解決問題能力的一種方法。

第三，面試內容除了它能否起到考察作用之外，還要考慮成本問題。看一個被面試者能否做出一道演算法題，是一個成本很低的做法（甚至連電腦都不需要），這對於公司來說是可以接受的。

綜上所述，面試演算法有必要。

C. 有面試過百度或者在百度任職的大數據開發崗位的同志么

以下是某位求職者面經：
網路面試的都是偏技術方面的問題，上來問有關系統方面的問題，我說我沒學過，然後他就問演算法了，他們偏向於一題多解，給出方案來還不算，要不斷優化，得到最優的解決方案，可惜我答的不是特別好，期間還讓編寫了一個小程序，整個過程大概一個小時，大部分時間都是我在推導題或者編程序。

D. java面試有哪些演算法

面試-java演算法題：
1.編寫一個程序，輸入n,求n！（用遞歸的方式實現）。
public static long fac(int n){ if(n<=0) return 0; else if(n==1) return 1; else return n*fac(n-1);
} public static void main(String [] args) {
System.out.println(fac(6));
}
2.編寫一個程序，有1，2,3,4個數字，能組成多少個互不相同且無重復數字的三位數？都是多少？
public static void main(String [] args) { int i, j, k; int m=0; for(i=1;i<=4;i++) for(j=1;j<=4;j++) for(k=1;k<=4;k++){ if(i!=j&&k!=j&&i!=k){
System.out.println(""+i+j+k);
m++;
}
}
System.out.println("能組成："+m+"個");
}
3.編寫一個程序，將text1.txt文件中的單詞與text2.txt文件中的單詞交替合並到text3.txt文件中。text1.txt文件中的單詞用回車符分隔，text2.txt文件中用回車或空格進行分隔。
import java.io.File;
import java.io.FileReader;
import java.io.FileWriter;

public class text{
public static void main(String[] args) throws Exception{
String[] a = getArrayByFile("text1.txt",new char[]{'\n'});
String[] b = getArrayByFile("text2.txt",new char[]{'\n',' '});
FileWriter c = new FileWriter("text3.txt");
int aIndex=0; int bIndex=0;

while(aIndex<a.length){
c.write(a[aIndex++] + "\n");
if(bIndex<b.length)
c.write(b[bIndex++] + "\n");
}

while(bIndex<b.length){
c.write(b[bIndex++] + "\n");
}
c.close();
}

public static String[] getArrayByFile(String filename,char[] seperators) throws Exception{
File f = new File(filename);
FileReader reader = new FileReader(f);
char[] buf = new char[(int)f.length()];
int len = reader.read(buf);
String results = new String(buf,0,len);
String regex = null;
if(seperators.length >1 ){
regex = "" + seperators[0] + "|" + seperators[1];
}else{
regex = "" + seperators[0];
}
return results.split(regex);
}

}
4.639172每個位數上的數字都是不同的，且平方後所得數字的所有位數都不會出現組成它自身的數字。（639172*639172=408540845584），類似於639172這樣的6位數還有幾個？分別是什麼？
這題採用的HashMap結構判斷有無重復，也可以採用下題的數組判斷。
public void selectNum(){
for(long n = 100000; n <= 999999;n++){
if(isSelfRepeat(n)) //有相同的數字，則跳過
continue;
else if(isPingFangRepeat(n*n,n)){ //該數的平方中是否有與該數相同的數字
continue;
} else{ //符合條件，則列印 System.out.println(n);
}
}
} public boolean isSelfRepeat(long n){
HashMap<Long,String> m=new HashMap<Long,String>(); //存儲的時候判斷有無重復值
while(n!=0){ if(m.containsKey(n%10)){ return true;
} else{
m.put(n%10,"1");
}
n=n/10;
} return false;
} public boolean isPingFangRepeat(long pingfang,long n){
HashMap<Long,String> m=new HashMap<Long,String>(); while(n!=0){
m.put(n%10,"1");
n=n/10;
} while(pingfang!=0){ if(m.containsKey(pingfang%10)){ return true;
}
pingfang=pingfang/10;
} return false;
} public static void main(String args[]){ new test().selectNum();
}
5.比如，968548+968545=321732732它的答案里沒有前面兩個數里的數字，有多少這樣的6位數。
public void selectNum(){
for(int n = 10; n <= 99;n++){
for(int m = 10; m <= 99;m++){ if(isRepeat(n,m)){ continue;
} else{
System.out.println("組合是"+n+","+m);
}
}
}
} public boolean isRepeat(int n,int m){ int[] a={0,0,0,0,0,0,0,0,0,0}; int s=n+m; while(n!=0){
a[n%10]=1;
n=n/10;
} while(m!=0){
a[m%10]=1;
m=m/10;
} while(s!=0){ if(a[s%10]==1){ return true;
}
s=s/10;
} return false;
} public static void main(String args[]){ new test().selectNum();
}
6.給定String,求此字元串的單詞數量。字元串不包括標點，大寫字母。例如 String str="hello world hello hi";單詞數量為3，分別是：hello world hi。
public static void main(String [] args) { int count = 0;
String str="hello world hello hi";
String newStr="";
HashMap<String,String> m=new HashMap<String,String>();
String [] a=str.split(" "); for (int i=0;i<a.length;i++){ if(!m.containsKey(a[i])){
m.put(a[i],"1");
count++;
newStr=newStr+" "+a[i];
}
}
System.out.println("這段短文單詞的個數是："+count+","+newStr);
}
7.寫出程序運行結果。
public class Test1 { private static void test(int[]arr) { for (int i = 0; i < arr.length; i++) { try { if (arr[i] % 2 == 0) { throw new NullPointerException();
} else {
System.out.print(i);
}
} catch (Exception e) {
System.out.print("a ");
} finally {
System.out.print("b ");
}
}
}
public static void main(String[]args) { try {
test(new int[] {0, 1, 2, 3, 4, 5});
} catch (Exception e) {
System.out.print("c ");
}
}

}
運行結果：a b 1b a b 3b a b 5b
public class Test1 { private static void test(int[]arr) { for (int i = 0; i < arr.length; i++) { try { if (arr[i] % 2 == 0) { throw new NullPointerException();
} else {
System.out.print(i);
}
}
finally {
System.out.print("b ");
}
}
}
public static void main(String[]args) { try {
test(new int[] {0, 1, 2, 3, 4, 5});
} catch (Exception e) {
System.out.print("c ");
}
}

}
運行結果：b c
8.單詞數
統計一篇文章里不同單詞的總數。
Input
有多組數據，每組一行，每組就是一篇小文章。每篇小文章都是由小寫字母和空格組成，沒有標點符號，遇到#時表示輸入結束。
Output
每組值輸出一個整數，其單獨成行，該整數代表一篇文章里不同單詞的總數。
Sample Input
you are my friend
#
Sample Output
4
public static void main(String [] args) {
List<Integer> countList=new ArrayList<Integer>(); int count;
HashMap<String,String> m;
String str; //讀取鍵盤輸入的一行（以回車換行為結束輸入） String[] a;

Scanner in=new Scanner(System.in);
while( !(str=in.nextLine()).equals("#") ){
a=str.split(" ");
m=new HashMap<String,String>();
count = 0; for (int i=0;i<a.length;i++){ if(!m.containsKey(a[i]) && (!a[i].equals(""))){
m.put(a[i],"1");
count++;
}
}
countList.add(count);
}s for(int c:countList)
System.out.println(c);
}

E. 都快2021年了，演算法崗位應該怎樣准備面試

說到演算法崗位，現在網上的第一反應可能就是內卷，演算法崗位也號稱是內卷最嚴重的崗位。針對這個問題，其實之前我也有寫過相關的文章。這個崗位競爭激烈不假，但我個人覺得稱作內卷有些過了。就我個人的感覺，這幾年的一個大趨勢是從迷茫走向清晰。

早在2015年我在阿里媽媽實習的時候，那個時候我覺得其實對於演算法工程師這個崗位的招聘要求甚至包括工作內容其實業內是沒有一個統一的標準的。可以認為包括各大公司其實對這個崗位具體的工作內容以及需要的候選人的能力要求都不太一致，不同的面試官有不同的風格，也有不同的標准。

我舉幾個例子，第一個例子是我當初實習面試的時候，因為是本科生，的確對機器學習這個領域了解非常非常少，可以說是幾乎沒有。但是我依然通過了，通過的原因也很簡單，因為有acm的獲獎背景，面試的過程當中主要也都是一些演算法題，都還算是答得不錯。但是在交叉面試的時候，一位另一個部門的總監就問我有沒有這塊的經驗？我很明確地說了，沒有，但是我願意學。

接著他告訴我，演算法工程師的工作內容主要和機器學習相關，因此機器學習是基本的。當時我就覺得我涼了，然而很意外地是還是通過了面試。

核心能力

由於我已經很久沒有接觸校招了，所以也很難說校招面試應該怎麼樣准備，只能說說如果是我來招聘，我會喜歡什麼樣的學生。也可以理解成我理解的一個合格優秀的演算法工程師應該有的能力。

模型理解

演算法工程師和模型打交道，那麼理解模型是必須的。其實不用說每一個模型都精通，這沒有必要，面試的時候問的模型也不一定用得到。但更多地是看重這個人在學習的時候的習慣，他是淺嘗輒止呢，還是會刨根究底，究竟能夠學到怎樣的地步。

在實際的工作當中我們可能會面臨各種各樣的情況，比如說新加了特徵但是沒有效果，比如升級了模型效果反而變差了等等，這些情況都是有可能發生的。當我們遇到這些情況之後，需要我們根據已知的信息來推理和猜測導致的原因從而針對性的採取相應的手段。因此這就需要我們對當前的模型有比較深入地了解，否則推導原因做出改進也就無從談起。

所以面試的時候問起哪個模型都不重要，重要的是你能不能體現出你有過深入的研究和理解。

數據分析

演算法工程師一直和數據打交道，那麼分析數據、清洗數據、做數據的能力也必不可少。說起來簡單的數據分析，這當中其實牽扯很多，簡單來說至少有兩個關鍵點。

第一個關鍵點是處理數據的能力，比如SQL、hive、spark、MapRece這些常用的數據處理的工具會不會，會多少？是一個都不會呢，還是至少會一點。由於各個公司的技術棧不同，一般不會抱著候選人必須剛好會和我們一樣的期待去招人，但是候選人如果一無所知肯定也是不行的。由於學生時代其實很少接觸這種實踐的內容，很多人對這些都一無所知，如果你會一兩個，其實就是加分項。

第二個關鍵點是對數據的理解力，舉個簡單的例子，比如說現在的樣本訓練了模型之後效果不好，我們要分析它的原因，你該怎麼下手？這個問題日常當中經常遇到，也非常考驗演算法工程師對數據的分析能力以及他的經驗。數據是水，模型是船，我們要把船駛向遠方，只懂船隻構造是不行的，還需要對水文、天象也有了解。這樣才能從數據當中捕捉到trick，對一些現象有更深入的看法和理解。

工程能力

雖然是演算法工程師，但是並不代表工程能力不重要，相反工程能力也很重要。當然這往往不會成為招聘的硬性指標，比如考察你之前做過什麼工程項目之類的。但是會在你的代碼測試環節有所體現，你的代碼風格，你的編碼能力都是你面試的考察點之一。

並不只是在面試當中如此，在實際工作當中，工程能力也很關鍵。往小了說可以開發一些工具、腳本方便自己或者是團隊當中其他人的日常工作，往大了說，你也可以成為團隊當中的開發擔當，負責其團隊當中最工程的工作。比如說復現一篇paper，或者是從頭擼一個模型。這其實也是一種差異化競爭的手段，你合理地負擔起別人負擔不了的工作，那麼自然就會成為你的業績。

時代在變化，行業在發展，如今的校招會問些什麼早已經和當年不同了。但不管怎麼說，這個崗位以及面試官對於人才的核心訴求幾乎是沒有變過的，我們從核心出發去構建簡歷、准備面試，相信一定可以有所收獲。

F. 要面試演算法工程師，大神給點相關經驗啊

演算法是比較復雜又基礎的學科，每個學編程的人都會學習大量的演算法。而根據統計，以下這18個問題是面試中最容易遇到的，本文給出了一些基本答案，供演算法方向工程師或對此感興趣的程序員參考。
1)請簡單解釋演算法是什麼?
演算法是一個定義良好的計算過程，它將一些值作為輸入並產生相應的輸出值。簡單來說，它是將輸入轉換為輸出的一系列計算步驟。
2)解釋什麼是快速排序演算法?
快速排序演算法能夠快速排序列表或查詢。它基於分割交換排序的原則，這種類型的演算法佔用空間較小，它將待排序列表分為三個主要部分：
·小於Pivot的元素
·樞軸元素Pivot(選定的比較值)
·大於Pivot的元素
3)解釋演算法的時間復雜度?
演算法的時間復雜度表示程序運行完成所需的總時間，它通常用大O表示法來表示。
4)請問用於時間復雜度的符號類型是什麼?
用於時間復雜度的符號類型包括：
·Big Oh：它表示小於或等於目標多項式
·Big Omega：它表示大於或等於目標多項式
·Big Theta：它表示與目標多項式相等
·Little Oh：它表示小於目標多項式
·Little Omega：它表示大於目標多項式
5)解釋二分法檢索如何工作?
在二分法檢索中，我們先確定數組的中間位置，然後將要查找的值與數組中間位置的值進行比較，若小於數組中間值，則要查找的值應位於該中間值之前，依此類推，不斷縮小查找范圍，直至得到最終結果。
6)解釋是否可以使用二分法檢索鏈表?
由於隨機訪問在鏈表中是不可接受的，所以不可能到達O(1)時間的中間元素。因此，對於鏈表來說，二分法檢索是不可以的(對順序鏈表或排序後的鏈表是可以用的)。
7)解釋什麼是堆排序?
堆排序可以看成是選擇排序的改進，它可以定義為基於比較的排序演算法。它將其輸入劃分為未排序和排序的區域，通過不斷消除最小元素並將其移動到排序區域來收縮未排序區域。
8)說明什麼是Skip list?
Skip list數據結構化的方法，它允許演算法在符號表或字典中搜索、刪除和插入元素。在Skip list中，每個元素由一個節點表示。搜索函數返回與key相關的值的內容。插入操作將指定的鍵與新值相關聯，刪除操作可刪除指定的鍵。
9)解釋插入排序演算法的空間復雜度是多少?
插入排序是一種就地排序演算法，這意味著它不需要額外的或僅需要少量的存儲空間。對於插入排序，它只需要將單個列表元素存儲在初始數據的外側，從而使空間復雜度為O(1)。
10)解釋什麼是「哈希演算法」，它們用於什麼?
「哈希演算法」是一個哈希函數，它使用任意長度的字元串，並將其減少為唯一的固定長度字元串。它用於密碼有效性、消息和數據完整性以及許多其他加密系統。
11)解釋如何查找鏈表是否有循環?
要知道鏈表是否有循環，我們將採用兩個指針的方法。如果保留兩個指針，並且在處理兩個節點之後增加一個指針，並且在處理每個節點之後，遇到指針指向同一個節點的情況，這只有在鏈表有循環時才會發生。
12)解釋加密演算法的工作原理?
加密是將明文轉換為稱為「密文」的密碼格式的過程。要轉換文本，演算法使用一系列被稱為「鍵」的位來進行計算。密鑰越大，創建密文的潛在模式數越多。大多數加密演算法使用長度約為64到128位的固定輸入塊，而有些則使用流方法。
13)列出一些常用的加密演算法?
一些常用的加密演算法是：
·3-way
·Blowfish
·CAST
·CMEA
·GOST
·DES 和Triple DES
·IDEA
·LOKI等等
14)解釋一個演算法的最佳情況和最壞情況之間有什麼區別?
·最佳情況：演算法的最佳情況解釋為演算法執行最佳的數據排列。例如，我們進行二分法檢索，如果目標值位於正在搜索的數據中心，則這就是最佳情況，最佳情況時間復雜度為0。
·最差情況：給定演算法的最差輸入參考。例如快速排序，如果選擇關鍵值的子列表的最大或最小元素，則會導致最差情況出現，這將導致時間復雜度快速退化到O(n2)。
15)解釋什麼是基數排序演算法?
基數排序又稱「桶子法」，是通過比較數字將其分配到不同的「桶里」來排序元素的。它是線性排序演算法之一。
16)解釋什麼是遞歸演算法?
遞歸演算法是一個解決復雜問題的方法，將問題分解成較小的子問題，直到分解的足夠小，可以輕松解決問題為止。通常，它涉及一個調用自身的函數。
17)提到遞歸演算法的三個定律是什麼?
所有遞歸演算法必須遵循三個規律：
·遞歸演算法必須有一個基點
·遞歸演算法必須有一個趨向基點的狀態變化過程
·遞歸演算法必須自我調用
18)解釋什麼是冒泡排序演算法?
冒泡排序演算法也稱為下沉排序。在這種類型的排序中，要排序的列表的相鄰元素之間互相比較。如果它們按順序排列錯誤，將交換值並以正確的順序排列，直到最終結果「浮」出水面。
滿意記得採納哈

G. 大公司筆試面試有哪些經典演算法題目

1、二維數組中的查找

具體例題：如果一個數字序列逆置之後跟原序列是一樣的就稱這樣的數字序列為迴文序列。例如：{1, 2, 1}, {15, 78, 78, 15} , {112} 是迴文序列, {1, 2, 2}, {15, 78, 87, 51} ,{112, 2, 11} 不是迴文序列。現在給出一個數字序列，允許使用一種轉換操作：選擇任意兩個相鄰的數，然後從序列移除這兩個數，並用這兩個數字的和插入到這兩個數之前的位置(只插入一個和)。現在對於所給序列要求出最少需要多少次操作可以將其變成迴文序列？

H. 如何准備互聯網公司面試（演算法相關）

書籍：《演算法導論》這本是大部頭，很多人都看不完。我本人也並沒有看完，它跟了我這么多年，完全是屬於常看常新的牛書。每一次看，都發現會有新的收獲。比如，以前並不知道求K位數或者中位數有平均為O(n)復雜度的演算法。看到了別的地方的參考資料，才知道，原來《算導》上專門有一小節講這個內容。我基本上是本科比較集中的看了一遍，研一的時候又集中的看了一遍，才算是粗略的看完。但是其實，很多理論性的，以及圖論一部分依然還是沒有看完。個人推薦，先從簡單的開始，挑選比較熟悉的一些偏重與數據結構方面的知識作為起點。這本書的習題非常重要，要是有時間，能夠全部做完，那絕對是能夠神功在手了。其實，集中把，第二部分（排序），第三部分（數據結構），第四部分（高級設計，我基本主要看動態規劃和貪心），第五部分（高級數據結構，B樹和二項堆，並差集），第六部分（圖演算法，最大流部分較難，自己可以看情況掌握）。這些部分可以先從演算法本身開始，偽代碼全部看懂。因為演算法導論講的很詳細，而且有來龍去脈，基本不會有太大難度。數學證明，推薦大家掌握，但是，突擊或者第一次，可以選擇性的看看。我自己是重復看，才把證明看掉的。第一次看的時候，基本都跳過了。不過，證明和習題是精髓！希望如果有時間，一定要補回來。《編程之美》《挑戰編程》這本書絕對是將全中國企業，或者說是一部分懶惰的企業面試題庫提升了一個檔次的一本神書。網路面我師兄的時候，我師兄直接把有一道題的最優解答出來了。但是，那個面試官顯然是不知道最優解，一直在引導我師兄答出，這本書裡面的第四個解。呵呵。書很不錯。全部看一遍並不難。說個不好聽的，可以背下來，而且相信我，基本上絕對有用！比如說，n!後面有多少個0。我相信，你們今年面試或者筆試，一定會碰到這道題。《挑戰編程》大家可以自行考慮一下吧，這個完全是針對acm競賽的，不過，看看題也不錯。《編程珠璣》業界神書嘛。習題全部做完就是了。其實都是些小東西，但是，基本上一步步考察你的解決問題的能力。個人覺得，最常用的就是bit map做排序或者去重，拓展一下就是bloom filter，我當時都是在這本書裡面看到的。《演算法技術手冊》這本書貌似出鏡不多。書很薄，代碼寫的非常好，其實基本上全部都是基礎演算法和數據結構的實現。但是，它牛逼就在於，代碼寫的太好了，基本上，看一遍，絕對能背下來。面試基礎很重要。基本上每個筆試或者面試，都會考一個100行以內的小程序。比如，給定一棵樹，以及其中一個節點x，要求出這棵樹的中序遍歷序列中，x的後續節點，非遞歸實現。這種題非常簡單，但是，真正寫對的，其實並不多。《STL源碼剖析》《C標准庫》都不厚。挑著看一遍非常舒服。特別是，看看STL每個數據結構迭代器類型啊，紅黑書如何實現啊。C標准庫，最常見的，比如strcpy()和memcpy()有什麼區別啊。特別是，STL，看過之後，對泛型還是能有一定了解的。《C專家編程》《Effective c++》《深度探索C++對象模型》第一本比較簡單，可以當八卦書看。後兩本其實也沒啥好說的，其實都是些業界公認的牛書。我再重復一遍也沒什麼意義。但是，的確，考察基本上也就都是這么幾本書上面的東西。基本上後兩本主要側重看c++對象方面的一些指示，特別是多態相關的。《具體數學》《組合數學》這兩本其實可以看作修身養性的書。我當時是時間比較充裕的時候看完的。純突擊，大家就可以跳過了。但是，看完真的很有用。比如說，你們就可以跟面試官扯約瑟夫環的構造解了（這道題我覺得80%會遇到），直接推推公式，就不用寫模擬代碼了。《組合數學》也是，很多筆試一般會有些小智力題。不過，其實一般的題目，不看這本書也可以搞定。所以，這兩本僅供參考。大家有興趣的時候，可以翻翻。《Linux內核源碼剖析》《Linux環境高級編程》…… 要是有機會，能看看最好。因為很多公司都會考察Linux相關的知識。最少要會點腳本，一些簡單的Linux命令，以及正則表達式什麼的。要是能聊聊內核源碼或者驅動開發什麼的東西，面試官肯定更加喜歡了。知識： c & c++ 首先要知道c和c++的區別。常考的有const的用法，一些生僻關鍵字比如extern，static的用法。結構體與類的差別。類裡面的字對齊問題，也就是說一個類到底有多大。以及一個空的類有多大。虛函數以及多態相關的顯然是重點。比如析構函數什麼時候需要寫成虛函數，構造函數是否可以是虛函數。 int a[10]; a 和 &a的區別。 java java我並不熟。但是基本上肯定會考一些虛擬機相關的，以及GC等知識。然後，一般招聘的java程序員都會問到很多多線程編程的東西，以及hadoop！這個絕對是重點，淘寶絕對就是問這個的。操作系統這個看工作崗位的實際要求。基本的進程線程區別==肯定是會問到的。要是要求高一些，就會問很多多線程編程的問題。一些競爭死鎖等基礎知識，一些進程調度的演算法，最近的kernel好像用的是CFS調度演算法。shell編程，如何讀取程序堆棧，寫一些core mp的讀取程序等等的。數據結構基本上所有的排序都要會寫。與樹有關的操作都要會些非遞歸版本。圖一般考的不多。Flood-Fill演算法等等。查找中位數。B樹和紅黑書最好要掌握，不用會寫，能扯扯基本就行。KMP，這個很有可能考！而且的確真的不好懂。要是實在不行，背下來吧。哈哈。網路這個其實比較基礎了。我個人網路方面的知識並不好。但是各種協議的基礎，幾次握手啊，一些操作系統的api實現到底是單工還是雙工用的是TCP還是UDP。我個人網路純粹靠拼RP。資料庫資料庫非常重要。基本的SQL肯定是要會的。最常見有一道題，inner join和out join的區別。MySQL是重點，基本上很多企業都是問這個。然後，網路扯多了會跟你扯MySQL引擎的一些東西。這些我就不太懂了。要是能准備的話，或者說的確是做這方面的，就可以著重多准備下。大規模數據處理這一塊絕對是重點！而且本身不是一個系統的學科分支。但是，基本上幾家大公司都會問這方面的。推薦先讀讀google那幾篇論文。Page Rank那一篇，然後Map Rece好像有幾篇吧。Big Table什麼的。推薦一個網址。這篇貌似是轉載的，我以前找到的源地址現在找不到了。處理這一類問題基本上思路都是，哈希，map rece以及bit map等等的。對了，推薦看一下外排序以及相關的敗者樹。這些都是大規模數據處理的一些典型問題。掌握了這些其實也就夠了。這塊有點屠龍之技的感覺，特別是對於學生，基本沒有誰能有機會把這些代碼實現出來。但是，沒辦法，這些公司就是喜歡考。看完那篇博客的，然後再自行查找一些資料，基本就夠了。萬變不離其中，而且，這些東西，沒辦法考那麼難的。推薦一個博客吧，作者收集了100+道面試題，並且全部給出了代碼。把這個全部看完，基本上很多面試筆試，都是這些原題。推薦Top Language裡面的今天我們思考系列，好幾年前的了。看大牛的思考過程，非常有幫助。希望自己能多想想再看答案。注意，google group好像有時被牆。我把發芽網的題庫版塊也掃了一遍。還有好多一時想不起來了。

I. 面試演算法和競賽演算法區別

面試演算法考察內容相比簡單，競賽演算法是以演算法(和數據結構)為核心主題的編程競賽。
演算法競賽一般要求在規定時間內做若幹道題目，並以編程的方式解決問題。
演算法面試只是技術面試的一部分，相對於比較基礎性。

J. 演算法面試

我在《再談「我是怎麼招程序員」》中比較保守地說過，「問難的演算法題並沒有錯，錯的很多面試官只是在膚淺甚至錯誤地理解著面試演算法題的目的。」，今天，我想加強一下這個觀點——我反對純演算法題面試！（注意，我說的是純演算法題）圖片源Wikipedia（點擊圖片查看詞條）我再次引用我以前的一個觀點——能解演算法題並不意味著這個人就有能力就能在工作中解決問題，你可以想想，小學奧數題可能比這些題更難，但並不意味著那些奧數能手就能解決實際問題。好了，讓我們來看一個示例（這個示例是昨天在微博上的一個討論），這個題是——「找出無序數組中第2大的數」，幾乎所有的人都用了O(n)的演算法，我相信對於我們這些應試教育出來的人來說，不用排序用O(n)演算法是很正常的事，連我都不由自主地認為O(n)演算法是這個題的標准答案。我們太習慣於標准答案了，這是我國教育最悲哀的地方。（廣義的洗腦就是讓你的意識依賴於某個標准答案，然後通過給你標准答案讓你不會思考而控制你）功能性需求分析試想，如果我們在實際工作中得到這樣一個題我們會怎麼做？我一定會分析這個需求，因為我害怕需求未來會改變，今天你叫我找一個第2大的數，明天你找我找一個第4大的數，後天叫我找一個第100大的數，我不搞死了。需求變化是很正常的事。分析完這個需求後，我會很自然地去寫找第K大數的演算法——難度一下子就增大了。很多人會以為找第K大的需求是一種「過早擴展」的思路，不是這樣的，我相信我們在實際編碼中寫過太多這樣的程序了，你一定不會設計出這樣的函數介面 —— Find2ndMaxNum(int* array, int len)，就好像你不會設計出 DestroyBaghdad(); 這樣的介面，而是設計一個DestoryCity( City& ); 的介面，而把Baghdad當成參數傳進去！所以，你應該是聲明一個叫FindKthMaxNum(int* array, int len, int kth)，把2當成參數傳進去。這是最基本的編程方法，用數學的話來說，叫代數！最簡單的需求分析方法就是把需求翻譯成函數名，然後看看是這個介面不是很二？！（註：不要糾結於FindMaxNum()或FindMinNum()，因為這兩個函數名的業務意義很清楚了，不像Find2ndMaxNum()那麼二）非功能性需求分析性能之類的東西從來都是非功能性需求，對於演算法題，我們太喜歡研究演算法題的空間和時間復雜度了。我們希望做到空間和時間雙豐收，這是演算法學術界的風格。所以，習慣於標准答案的我們已經失去思考的能力，只會機械地思考演算法之內的性能，而忽略了演算法之外的性能。如果題目是——「從無序數組中找到第K個最大的數」，那麼，我們一定會去思考用O(n)的線性演算法找出第K個數。事實上，也有線性演算法——STL中可以用nth_element求得類似的第n大的數，其利用快速排序的思想，從數組S中隨機找出一個元素X，把數組分為兩部分Sa和Sb。Sa中的元素大於等於X，Sb中元素小於X。這時有兩種情況：1）Sa中元素的個數小於k，則Sb中的第 k-|Sa|個元素即為第k大數；2） Sa中元素的個數大於等於k，則返回Sa中的第k大數。時間復雜度近似為O(n)。搞學術的nuts們到了這一步一定會歡呼勝利！但是他們哪裡能想得到性能的需求分析也是來源自業務的！我們一說性能，基本上是個人都會問，請求量有多大？如果我們的FindKthMaxNum()的請求量是m次，那麼你的這個每次都要O(n)復雜度的演算法得到的效果就是O(n*m)，這一點，是書獃子式的學院派人永遠想不到的。因為應試教育讓我們不會從實際思考了。工程式的解法根據上面的需求分析，有軟體工程經驗的人的解法通常會這樣：1）把數組排序，從大到小。2）於是你要第k大的數，就直接訪問 array[k]。排序只需要一次，O(n*log(n))，然後，接下來的m次對FindKthMaxNum()的調用全是O(1)的，整體復雜度反而成了線性的。其實，上述的還不是工程式的最好的解法，因為，在業務中，那數組中的數據可能會是會變化的，所以，如果是用數組排序的話，有數據的改動會讓我重新排序，這個太耗性能了，如果實際情況中會有很多的插入或刪除操作，那麼可以考慮使用B+樹。工程式的解法有以下特點：1）很方便擴展，因為數據排好序了，你還可以方便地支持各種需求，如從第k1大到k2大的數據（那些學院派寫出來的代碼在拿到這個需求時又開始撓頭苦想了）2）規整的數據會簡化整體的演算法復雜度，從而整體性能會更好。（公欲善其事，必先利其器）3）代碼變得清晰，易懂，易維護！（學院派的和STL一樣的近似O(n)復雜度的演算法沒人敢動）爭論你可能會和我有以下爭論，如果程序員做這個演算法題用排序的方式，他一定不會像你想那麼多。是的，你說得對。但是我想說，很多時候，我們直覺地思考，恰恰是正確的路。因為「排序」這個思路符合人類大腦處理問題的方式，而使用學院派的方式是反大腦直覺的。反大腦直覺的，通常意味著晦澀難懂，維護成本上升。就是一道面試題，我就是想測試一下你的演算法技能，這也扯太多了。沒問題，不過，我們要清楚我們是在招什麼人？是一個只會寫演算法的人，還是一個會做軟體的人？這個只有你自己最清楚。這個演算法題太容易誘導到學院派的思路了。是的這道「找出第K大的數」，其實可以變換為更為業務一點的題目——「我要和別的商戶競價，我想排在所有競爭對手報價的第K名，請寫一個程序，我輸入K，和一個商品名，系統告訴我應該訂多少價？（商家的所有商品的報價在一數組中）」——業務分析，整體性能，演算法，數據結構，增加需求讓應聘者重構，這一個問題就全考了。你是不是在說演算法不重要，不用學？千萬別這樣理解我，搞得好像如果面試不面，我就可以不學。演算法很重要，演算法題能鍛煉我們的思維，而且也有很多實際用處。我這篇文章不是讓大家不要去學演算法，這是完全錯誤的，我是讓大家帶著業務問題去使用演算法。問你業務問題，一樣會問到演算法題上來。小結看過這上面的分析，我相信你明白我為什麼反對純演算法面試題了。原因就是純演算法的面試題根本不能反應一個程序的綜合素質！那麼，在面試中，我們應該要考量程序員的那些綜合素質呢？我以為有下面這些東西：會不會做需求分析？怎麼理解問題的？解決問題的思路是什麼？想法如何？會不會對基礎的演算法和數據結構靈活運用？另外，我們知道，對於軟體開發來說，在工程上，難是的下面是這些挑戰：軟體的維護成本遠遠大於軟體的開發成本。軟體的質量變得越來越重要，所以，測試工作也變得越來越重要。軟體的需求總是在變的，軟體的需求總是一點一點往上加的。程序中大量的代碼都是在處理一些錯誤的或是不正常的流程。所以，對於編程能力上，我們應該主要考量程序員的如下能力：設計是否滿足對需求的理解，並可以應對可能出現的需求變化。

閱讀全文

熱點內容

反編譯連接資料庫發布：2025-01-19 22:07:55 瀏覽：786

貴州省發票軟體伺服器地址發布：2025-01-19 22:00:12 瀏覽：694

linux的單用戶模式發布：2025-01-19 21:55:29 瀏覽：425

android型號發布：2025-01-19 21:48:14 瀏覽：337

供應外置存儲陣列櫃發布：2025-01-19 21:32:41 瀏覽：999

柴火壓縮機發布：2025-01-19 21:20:53 瀏覽：624

途觀5053匹配密碼在哪裡發布：2025-01-19 21:19:58 瀏覽：352

晶銳買哪個配置發布：2025-01-19 21:19:52 瀏覽：329

vpn如何訪問伺服器發布：2025-01-19 21:09:31 瀏覽：496

如何測試電視的配置發布：2025-01-19 21:00:48 瀏覽：610

百度面試演算法

與百度面試演算法相關的資訊