數值演算法研發
Ⅰ 有工作經驗的開發者面試有數據演算法么
老實說,本人沒有任何實際開發經驗,但馬上就要面試軟體研發工程師職位,那個急啊!
我本想隨便找幾個項目經驗矇混過關,但是仔細琢磨還是不行啊!因為在實際開發項目中,一個人不可能負責項目的方方面面,只是負責項目的一小塊,要是整出個完整的項目經驗,那多半是閉門造車或者網上當的,你們說是吧!
所以,我求你們的,將你們工作中實際參與的項目以及實際做的事情跟我說說吧!我現在是巧婦難為無米之炊啊!我的文采一向很好,可是這沒個材料,我真他娘的難編啊,有才無用啊!
現在這些混蛋面試官都要什麼項目經驗,你們說我不編行嗎?幫幫忙吧!謝謝您們的回答。其實有兩點我是可以肯定的:
1、技術細節肯定沒有問題,本人深信自己的編程功底。
2、本人獨立研發過幾個小的項目,但都是閉門造車的,難登大雅之堂,所以這里才很為難的啊。
我現在急需的就是有個項目作為載體好說事,要不就算你技術再牛,也沒辦法證明不是!但是我自己做的小項目雖說五臟俱全,但是那太小了的,幾天就能搞定的項目,你總不能編個幾個月吧,而且還分模塊。。。。。
Ⅱ 數值計算方法的主要研究對象有哪些其常用基本演算法主要包括哪三個方面
數值計算方法的主要研究對象:研究各種數學問題的數值方法設計、分析、有關的數學理論和具體實現。其常用基本演算法在數值分析中用到迭代法的情形會比直接法要多。例如像牛頓法、二分法、雅可比法、廣義最小殘量方法及共軛梯度法等等。在計算矩陣代數中,大型的問題一般會需要用迭代法來求解。
許多時候需要將連續模型的問題轉換為一個離散形式的問題,而離散形式的解可以近似原來的連續模型的解,此轉換過程稱為離散化。
例如求一個函數的積分是一個連續模型的問題,也就是求一曲線以下的面積若將其離散化變成數值積分,就變成將上述面積用許多較簡單的形狀(如長方形、梯形)近似,因此只要求出這些形狀的面積再相加即可。
(2)數值演算法研發擴展閱讀
數值分析也會用近似的方式計算微分方程的解,包括常微分方程及偏微分方程。
常微分方程往往會使用迭代法,已知曲線的一點,設法算出其斜率,找到下一點,再推出下一點的資料。歐拉方法是其中最簡單的方式,較常使用的是龍格-庫塔法。
偏微分方程的數值分析解法一般都會先將問題離散化,轉換成有限元素的次空間。可以透過有限元素法、有限差分法及有限體積法,這些方法可將偏微分方程轉換為代數方程,但其理論論證往往和泛函分析的定理有關。另一種偏微分方程的數值分析解法則是利用離散傅立葉變換或快速傅立葉變換。
Ⅲ 數據結構和演算法在實際的軟體開發中都有哪些
應用太多了。
基本上來說C#是基於面向對象語言,你所定義的所有類/結構體都算是數據結構,而且在.net類庫中已經定義中諸多可用的類型以供使用。實際開發中根本就離不開結構與演算法。
題主之所以有這樣的問題,基本上認識到了很多程序員易犯的一個毛病——理論知識與實際應用中的脫節問題,不少程序員都說自己寫程序用不上理論知識,或者是理論無用。我一直認為理論才是真正編程的指導,別說你所學的理論知識了,有時我們必須遵守一些軟體活動上的標准/規范/規定。比如ISO29500標准有多少程序員讀過或聽說過?他實事就是關於openxml的一個國際標准,我們要想達到通用的程序,這些標准還是讀一讀的好。
扯回你的問題,什麼是數據結構,什麼是演算法?如果你真的狹義理由數據結構,或者只是從課本上例子來說,數據結構被定義成一個只有屬性成員的類或結構體才算是數據結構嗎?事實上並不是,那麼是不是只有鏈表/棧/隊列才算是數據結構呢?可以說這是某些人狹義理解數據結構時的一種常規定勢思維,但事實上來說,類或結構是數據結構的基本,否則你鏈表存在的實體到底是什麼東西?所以數據結構包含著基本結構與狹義上的順序表/鏈表/棧/隊等存在實體的集體。為什麼我說數據結構在實際運用中廣泛體現呢?就數據結構而言,課本上只是為了講明白結構而已,弱化了其中實體的真正含義,而且不語言的具體實現亦不盡相同,所以他們所講的數據結構是基本理論的。
我來個例子:鏈表(C#語言)
publicclassMember
{
publicstringName{get;set;}
publicstringResponsibility{get;set;}
publicstringPosotion{get;set;}
}
publicclassMemberNode
{
publicMemberMember{get;set;}
publicMemberNext{get;set;}
}
//Node其他就是鏈表中的一個結點結構,這個結點結構除了指明當前的Member之下還指向下Next的下一個結構結構,它最終可以形成一個鏈表。這就是定義的一個鏈表。
從以上例子上你可以看出這是一個類似於課本的標準定義,但事實上在C#語法中存在泛型的特點,那麼這類似的結構我們不須要一個個地定義了!所以在不同的語言中為了方便編程者,我們甚至可以把這樣的結構進行簡單化,從而達到一種最簡單的使用方式。以C#為例,我們可以使用Node<T>來表示鏈表/List<T>表示順序表/Stack<T>表示棧/Queue<T>表示隊列,在這種情況下,我們只需要定義我們的泛型即可,結構鏈之類的本身使用泛型已經在類庫中實現了——雖然你不用定義,但不代表不使用或者不用理解這其中的知識。而在課本講理論的時候,他不可能附帶泛型來講的,所以很多人認為自己去定義數據結構才行,那才是「真正」的數據結構,其實不然。以鏈表為例,我們需要一個節點除了其實體意義之外,還存在指向下一結點的指針(其實是地址引用)才算是數據結構。根據課本,他們必須這么定義(C#):
publicclassMemberNode
{
publicstringName{get;set;}
publicstringResponsibility{get;set;}
publicstringPosition{get;set;}
publicMemberNodeNext{get;set;}
}
//死讀書的只會承認這種才是真正的數據結構吧(鏈表節點)
事實上,鏈表講的只是一種形式,能最終形成的一種組織數據結構的形式。這個代碼會導致我們出現一種極大的誤解——每個類型的結構都需要重新定義一次。如果有多個類型結構的話,我們會出現多個不同的定義,這會導致將來類的定義越來越多,對於維護上來說是比較麻煩的。由於設計模式/面向切片等各種開發方式的介入,我們會使用相對比較簡單的形式。所以才會有我定義兩個類的進步,而後可以出現泛型的更進一步。
你可以這樣理解,這種課本上的結構,會導致我們造成每種結構基本上都需要重新定義一次,我最開始給出的例子可以使用繼承的方式,實現某個基類的數據結構(下面的似乎也行,但在使用中可能會出現部分問題),而Node<T>則從根本上解決了這個問題,可以支撐多種類型。
所以此時在理解數據結構時,比如Node<T>,他不旦要求理解鏈表的節點,還要理解T泛型,那麼在數據結構上來說,它指的不再是單一的節點結構,還在包括一個基礎的類型。
換句話來說,你在C#等語言中已經不需要再做類似的定義了,只需要定義其基本結構類型即可。但課本上在講知識的時候,它不可能只針對面向對象或支持泛型的語言來講,若不支持泛型時,我們必須使用課本上或我最開始寫的例子中的形式,若不支持繼承的面向過程語言,那麼課本上的知識就是硬性的規定,你必須以這種形式來說,而引用則使用指針引用的方式(面向對象的引用其實是一種引用型引用,也就是址引用或稱地址引用,與指針類似)。
相信講到這里你能明白,數據結構在不同的語言中只是變了個形而已,並不是必須是存在指針的才是,也不是只說表面上的那點東西。早期教程都是以fortain語言為主的,而且課本的目的是講清道理,而不是一種規定。死讀書的人以為用不到數據結構,其實他們一直在使用。
再來說一下演算法,演算法是什麼?是解決問題的一種模式,比如解二元一次方程等等,所以演算法的定義其實已經告訴你,順序代碼他也算是一種演算法,不能說只有背包問題,八皇後問題,回溯問題才算是演算法——你能明白嗎?其實你正常寫的就是一種演算法,這種演算法簡單,就是順序執行下來就可以了,他也是一種演算法的,就算解二元一次方程組有固定的模式(演算法),但不代表加減法就不是演算法了!所以演算法也是常用的東西,那麼你學習的演算法其實算是開辟思路的一種而已。演算法自身的概念已經決定,基本上程序都是由結構與演算法構成。我也來舉個例子,怎麼判斷某個鏈表是否為循環鏈表?是你的回溯演算法,貪心演算法還是背包演算法?它們只是在解決一些典型問題的一種通用方式而已,很顯然,我的問題不是這種典型問題,但不代表他不典型,我們正常的演算法是設計兩個變數等於頭元素,然後開始進入循環,一個變數每次向下推一,即找到他下一個節點,而另一個變數每次找到其孫節點,就算當於兩個變數一個每次向下推進一次,而另一個每點推進兩次(如果可能),如果不是循環鏈表,則進兩次的那個會在鏈表總長度的一半時,遇到空引用,否則會在某一時間兩指針引用同一對象(不是對象相等,而是引用相同的對象),什麼意思呢,好象兩個人在圓型跑道上跑步,一個每秒1米,另一個每秒2米,同時同地同向出發,最歸跑得快的那個會追上跑得慢的那個!當然這種情況下你也可以給他起個名字,叫「追及演算法」?如果只有你學的那幾個典型演算法是演算法的話,這個算不算演算法?
現在我們的問題是,如果語言層面上已經實現了這些東西,那麼這些理論我們是否可以不用理解就可以了?答案是可以——如果你只是一個不思進取的程序員或允許bug亂飛的沒有責任心的編程人員的話,可以不用理解——畢竟有些人只是「混」飯吃而已!
理解了不會去應用,這就是典型的理論聯系不到實際,他們也不知道自己的代碼將如何控制。我舉一個例子,由於性能等各方面的要求,我們要使用多線程對某些數據進行處理。怎麼處理?不好人會使用多線程——他們定義一個臨界資源,然後讓多個線程在讀取數據表(DataSet)時進行阻塞,然後每個線程去處理那些超時長的問題,處理完的時個再按這種方式讀取數據——這樣有問題嗎?沒有,這也算是演算法的一種!反正如果編程代碼有功底的話沒有任何問題的,這種代碼算不算優雅呢——很多人認為代碼的優雅就是代碼編寫過程的形式或是良好的編程習慣!這里邊其實用不到數據結構與演算法的。
好吧,我承認,但如果我們換一句思路來看看,如果我用一個線程負責讀取數據,並不停地放入到一個隊列中,而多個線程從隊列中不停地讀取處理這些放入的數據,這樣如何?我的意思是說,並沒有直接在DataSet中處理,而是選擇使用隊列的方式。
我們看一個問題,這個隊列Queue<T>,一個線程用來插入數據,多個線程用來讀取數據,而且要保證不能重復,那麼我們可以使用隊列的安全版本(CorrentQueue<T>,在.net中如果非線程安全的情況下,多線程使用實應該找到其對應的安全版本或者控制線程安全)。
插入線程如果發現隊列中的長度(容量)較大時,可以暫緩插入。這樣可以保證隊列的長度基本固定,佔用內存得到控制(不是DataSet批量讀來一大堆),由於使用安全隊列,所以各線程不用考慮線程之間的安全問題,每個線程從隊中獲得數據並刪除,可以保證數據只被處理一次。當然還可以考慮優雅的通知機制,插入線程在插入數據時通知處理線程啟動,如果插入速度過快,發現插入數量達指定的長度(比如30個),停止插入,插入線程阻塞;處理處理再次處理時可通知插入線程再進行插入。
這也算是一種演算法吧?它可以讓插入線程與處理線程同時工作,而使用DataSet那種常規的結果時,只能是等待處理完或加入多個控制條件進行控制,既然這么控制的話,何不直接使用隊列的方式?CorrentQueue<T>中的T也完全可以是一條記錄DataRow嘛!
如果你認為第一種是你經常使用方式,那麼演算法對於你來說學與不學無所謂的,你必須使用自己的編程/調試功底以保證你的代碼盡量很少出錯或不出錯。而如果你認為第二種方案優雅一些的話,那麼你會認為你學習的演算法與結構還是有用的,理論與實踐結合了。
我之所以舉這么一個例子,其實告訴你的無非是幾點非常重要的信息:
你有選擇演算法的自由(只不過是代碼質量、後期維護的問題)
如果你知道的較多的演算法與結構,你會有更多的選擇。
演算法或結構在實際使用中,所謂的典型問題並不是使用場景和書上描述一模一樣(試想一下,我第二種考慮的例子中,是不是跟書上比他不典型?其實也是非常典型的)
分析問題時,應該拿要點,而不是整體去套。(如果整體去套用的話,你肯定會想不到使用哪種結構或演算法)
不管是數據結構/演算法/設計模式都要求是靈活運用,而不是場景對比使用,也不是生搬硬套。
試想一下,你的背包問題,怎麼可能公司也讓你分拆包裝?你的八皇後問題公司恰好讓你下棋?你的貪心演算法公司恰好讓你找零錢?你的回溯演算法公司恰好讓你走迷宮?學不能致用的原因就是太死板——這幾個舉個例子的場景你再遇到或理能遇到的機率是非常小的,所以如果覺得學了沒用,那就真沒用了——只不過不是演算法沒用,而是人沒人!
講個小故事:從前一個家人的板凳壞了,要找一個合適的兩股叉的樹杈重新製做一個板凳腿,讓孩子到樹園里找了半天,孩子回來說「我都沒見過有向下叉的樹杈!他老爹氣得要死——怎麼會可能有向下長的樹杈呢!這孩子是不是笨——你就不會把地刨了找一個向下分叉的樹根!
演算法也是一樣,迷宮找路可以使用回溯演算法,但不是所有的回溯演算法都用於迷宮找路——它還可以用來設計迷宮!嘿嘿嘿!
Ⅳ 做研發好還是做數據挖掘或演算法好,或者說哪個更有前途
這個看怎麼說,事實上如果你做得比較淺,都很容易,因為門檻低。也正因為這個所以你能做,別人也能做。因此談不上什麼前途。但你如果做得深,那基本都不會太差。
Ⅳ 數據演算法工程師主要是做什麼的
只有數據科學家和演算法工程師,數據科學家關注於用演算法研究數據背後的信息,演算法工程師負責將科學家研發的演算法應用到實際生產活動中
演算法工程師就是會一些人工智慧演算法的工程師。工作就是做一些人工智慧演算法相關的任務:根據任務整理數據(如果沒有數據最好可以協助建立獲取數據的流程)跑模型,改進模型部署模型,測試,優化速度等等其實AI行業比較欠缺好的產品經理,演算法工程師在需求設計和溝通上最好也能參合參合,都是有益的。
想了解數據演算法工程師這個職業可以到CDA認證中心去了解一下,CDA認證,致力於打造全球數據人才考核行業標准,推動全球數人才發展。包括開發和整合國際數據科學領域的前沿技術及優質資源; 制定並完善數據科學行業人才標准與職業道德行為准則;編寫和建立專業教材體系與題庫;組織並實施命題審題、人才評定和考試服務;管理會員與提供行業咨詢服務等事務。
Ⅵ Google用了哪些數值演算法
首先,每個數值的值出現的概率比較平均,所以用哈夫曼(Huffman)演算法無法取得太專業了,建議你去專門的論壇去問.用英文去google搜下,或者google 討論組.
Ⅶ 數值模擬主要過程和步驟
1、首先要建立反映問題(工程問題、物理問題等)本質的數學模型。
具體說就是要建立反映問題各量之間的微分方程及相應的定解條件。這是數值模擬的出發點。沒有正確完善的數學模型,數值模擬就無從談起。牛頓型流體流動的數學模型就是著名的納維—斯托克斯方程(簡稱方程)及其相應的定解條件。
2、尋求高效率、高准確度的計算方法
由於人們的努力,目前已發展了許多數值計算方法。計算方法不僅包括微分方程的離散化方法及求解方法,還包括貼體坐標的建立,邊界條件的處理等。這些過去被人們忽略或迴避的問題,現在受到越來越多的重視和研究。
3、開始編製程序和進行計算
實踐表明這一部分工作是整個工作的主體,占絕大部分時間。由於求解的問題比較復雜,比如方程就是一個非線性的十分復雜的方程,它的數值求解方法在理論上不夠完善,所以需要通過實驗來加以驗證。正是在這個意義上講,數值模擬又叫數值試驗。應該指出這部分工作決不是輕而易舉的。
(7)數值演算法研發擴展閱讀:
數值模擬的發展史:
1955年Peaceman與Rachford研發的交替隱式解法(ADI)是數值模擬技術的重大突破。該解法非常穩定,而且速度快,所以迅速在包括石油,核物理,熱傳導等領域得到廣泛應用。1958年Douglas,Jim和Blair,P.M第一次進行了考慮毛管壓力效果的水驅模擬。
60年代數值模擬技術的發展主要在數值解法,第一個有效的數值模擬解法器是1968年Stone推出的SIP(Strong Implicit Procere)。該解法可以很好地用來模擬非均質油藏和形狀不規則油藏。
Stone在70年代發表了三相相對滲透率模型,由油水和油氣兩相相對滲透率計算油、氣、水三相流動時的相對滲透率,該技術現在還廣為應用。70年代另一項主要成就是Peaceman提出的從網格壓力來確定井底流壓的校正方法。
參考資料來源:網路—數值模擬
Ⅷ 演算法在研發階段,對AI數據標注行業有什麼樣的需求
不理解問的是什麼
演算法研發階段和數據標注行業有什麼關系
一般來說數據質量越高 對演算法要求就越低,如果數據質量不夠 就得更厲害的演算法來建模
從技術上說 演算法實現只需要少量數據,因為實現演算法只管格式,不管內容質量的
Ⅸ 數據挖掘,數據開發,演算法工程師是什麼職位
大數據在帶來極大商業價值的同時,也面臨著巨大的人才需求。據數聯尋英發布的《大數據人才報告》稱:目前我國大數據人才僅 46 萬,在未來 3 - 5 年內大數據人才缺口達 1,500,000 之巨。