c语言网页编程
⑴ 如何编写c语言程序
准备材料
windows电脑、VC++(DEV_C++)
1.打开桌面上的DEV_C++,进入如下界面:
⑵ c语言怎样实现网络编程
1、枝并要实现网络编程,首先得了解网络编程的原理。
大部分网络编程底层都是通过TCP/IP或者UDP协议进行通讯,不管是TCP还是UDP通讯,都是通过调用socket实现的。
Socket是应用层与TCP/IP协议族通信的中间软件抽象层,它是一组接口。在设计模式中,Socket其实就是一个门面模式,它把复杂的TCP/IP协议族隐藏在Socket接口后面,对用户来说,一组简单的接口就是全部,让Socket去伏搭灶组织数据,以符合指定的协议。
Socket通讯分为两部分:服务器端和客户端,服务器端监听客户端的连接,连接上之后,实现数据通讯,流程
2、用C语言调用Socket实现通讯
服务器端示例代缺扮码如下:
#include
#include
#include
#include
#include
#include
#include
#include
#definePORT1500//端口号
#defineBACKLOG5/*最大监听数*/
intmain(){
intsockfd,new_fd;/*socket句柄和建立连接后的句柄*/
structsockaddr_inmy_addr;/*本方地址信息结构体,下面有具体的属性赋值*/
structsockaddr_intheir_addr;/*对方地址信息*/
intsin_size;
sockfd=socket(AF_INET,SOCK_STREAM,0);//建立socket
if(sockfd==-1){
printf("socketfailed:%d
⑶ c镐庝箞璁捐$绣椤礳璇瑷镐庝箞锅氱绣椤
濡备綍锅氱绣椤佃捐
宸ュ叿/铡熸潗鏂涓浜虹数鑴
缃戦〉璁捐¤蒋浠:FrontPage(绠鍗曟槗鐢锛岄珮搴︾﹀悎IE娴忚埚櫒鏀鎸佺殑璁捐)锛汥reamWave(锷熻兘寮哄ぇ锛屾垚鍝佽捐℃敮鎸佸氱嶆祻瑙埚櫒)锛
锲惧儚澶勭悊杞浠:Photoshop鎴朏ireworks锷ㄧ敾鍒朵綔:FlashMX
鐭ヨ瘑鍌ㄥ:
锘烘湰镄勭绣缁灭煡璇嗭绂
HTML鐭ヨ瘑
寰堢亩鍗曘傛棭链熷彧链夎繖涓鏄鐢ㄦ潵鍒朵綔缃戦〉镄勶纴鍙浠ョ敤璁颁簨链缂栬緫锛岀敤娴忚埚櫒镓揿紑钖庡氨鍙浠ュ憟鐜扮绣椤电殑鍐呭广
CSS鐭ヨ瘑
绾ц仈镙峰纺琛ㄧ缉鍐欎负
链嶅姟鍣ㄨ剼链鐭ヨ瘑锛屽侫SP鎴朠HP銆
ASP鏄疉ctiveServerPage镄勭缉鍐欙纴镒忔濇槸
PHP鏄鑻辨枃瓒呮枃链棰勫勭悊鍣ㄧ殑缂╁啓銆侾HP鏄涓绉嶅祵鍏ュ纺HTML璇瑷锛屾槸涓绉嶈剼链璇瑷锛屽湪链嶅姟鍣ㄧ镓ц岋纴宓屽叆鍦℉TML鏂囨。涓銆傝瑷椋庢牸绫讳技C璇瑷锛屽簲鐢ㄥ箍娉涖
鏂规硶/姝ラ
鍑嗗囩煡璇嗭纴鍖呮嫭瀛︿範浣跨敤涓婅堪钖勭嶅伐鍏峰拰杞浠躲
浠旂粏𨱍虫兂浣犳兂锅氢粈涔堛傜绣绔欑殑鍐呭瑰拰鐢ㄩ旀潵鍐冲畾鍒朵綔缃戦〉镄勯庢牸銆备絾鏄鏁翠綋缃戦〉璁捐″簲璇ラ伒寰涓浜涘繀瑕佺殑闅愬惈瑕佹眰:
1.绠鍗:瀹冨彲浠ヨ╄块梾钥呬竴鐩浜嗙劧锛岃屼笉浼氲╀粬浠镒熷埌绻佺悙鍜屾垒涓嶅埌浠栦滑闇瑕佺殑涓滆タ銆
2.绐佸嚭涓婚:娌℃湁涓婚樼殑缃戦〉涔熶细璁╀汉澶卞幓娴忚堢殑鍏磋叮銆
3.瀹炵敤镐:涓涓缃戦〉鍗充娇鍐嶆纾浜锛屽傛灉瀵硅块梾钥呮病链夌敤锛屼篃镞犳硶钖稿紩浜轰滑镄勬敞镒忓姏銆傛湁鍙ヨ瘽璇:鍙链夎闇瑕侊纴浣犳墠鑳界敓瀛樸
鏀堕泦淇℃伅锛屽傚浘鐗囥佹枃瀛楀拰鍏朵粬鍙鑳藉湪缃戦〉涓浣跨敤镄勫唴瀹广傚杽浜庡埄鐢ㄧ栌搴︺佽胺姝岀瓑鎼灭储寮曟搸镓惧埌镊宸遍渶瑕佺殑淇℃伅銆
锽勪簬鍒╃敤缃戠粶涓婂凡链夌殑淇℃伅鍜屽唴瀹癸纴姣斿备竴浜涘紑婧愪唬镰併(缃戠粶鏄澶ф潅鐑╋纴钖勭崭俊鎭楸奸緳娣锋潅锛屽悇绉崭汉鐗╅奔榫欐贩𨱒傦纴瑕佸︿细鍒呜鲸銆)
娉ㄦ剰镊宸卞埗浣灭殑缃戦〉鍐呭逛笌绀句氦镞朵唬镄勪竴镊存э纴鍙婃椂镟存柊缃戦〉甯冨眬銆
缁撴潫
闇瑕佹敞镒忕殑浜嬮”
杩欎釜缁忛獙鍙鏄绮楃暐璇磋:浠ュ强闇瑕佺殑宸ュ叿鍜岀煡璇嗗偍澶囥傚傛灉𨱍虫垚涓虹绣绔欐湅鍙嬶纴璇风户缁瀛︿範缃戠珯寤鸿炬墍闇镄勭煡璇嗐佸缓璁炬祦绋嫔拰娉ㄦ剰浜嬮”銆
缃戦〉璁捐℃祦绋嫔氨鏄杩欎箞锅氱殑銆傚笇链涘逛綘链夊府锷┿傛劅璋㈡偍阒呰绘湰鏂囷紒
绠鍗旷殑C璇瑷缂栫▼锛屽彲浠ュ仛缃戠珯钖?绠鍗旷殑锛
绠鍗旷殑c鏄镞犳硶锅氱绣绔欑殑锛孋璇瑷鏄闱㈠悜杩囩▼镄勭▼搴忚瑷銆傚湪缃戦〉鍒朵綔涓瑿璇瑷涓昏佺紪鍐欐搷浣灭郴缁熺殑婧愪唬镰侊纴铹跺悗鍙浠ョ敤缂栧啓涓浜涚▼搴忎慨澶崭竴浜涙搷浣灭郴缁熸纺娲炪傚綋涓婣SP锛.NET锛孭HP锛孞SP鏄鐜板湪锅氱绣绔欐渶骞挎硾镄勭▼搴忚瑷銆傚傛灉鍙鏄锅氢竴浜涚亩鍗旷殑镊宸辩粌涔犵殑缃戠珯鍙浠ヨ嚜瀛︿竴涓媓tml銆
C鍜孋++鍙浠ョ敤𨱒ュ仛缃戠珯钖楋纻
鍙浠ュ仛缃戠珯浣嗕笉寤鸿浣跨敤锛孋++锅氱绣绔椤お楹荤储浜嗭纴涓岖℃槸锷熻兘杩樻槸澶栬傦纴璋冭捣𨱒ラ兘澶楹荤储
c濡备綍灏嗙绣椤垫坊锷犲埌妗岄溃锛
鍗曞嚮缃戦〉镄勬爣棰樻爮鈫掑彸阌镣瑰嚮鈫掑缓蹇鎹锋柟寮忊啋娣诲姞鍒版岄溃
⑷ 如何利用c语言分析网页
首先,你这个想法还是很不错的,我以前也想这么做过。不过,学习html语言在这里肯定是次要的,主要的还是要学会分析的方法,而不是掌握被分析的内容,你说是吧?
如果要用程序抓取网页自动保存到本地,就要会用socket编程,或者学习使用libcurl库,这些都比学html语言有用的多,不做网页抓取的时候,这些知识依然非常有用。而且,不同的网页,内容不同,规律可能也不同。比如你给的那个例子网址,我右键查看了源代码,里面就根本没有所谓的<td>、<tr>标签,即它的表格不是通过这些标签来实现的。所以,让你去看这些标签,就是南辕北辙了。
网页分析,说到底还是字符串处理和分析。所以,你如果真的想学,不如好好学一下正则表达式和字符串处理相关的函数,以及函数库,比如tidy库等。正则表达式是用来匹配一类字符串的,方便找规律,也方便处理,你稍微学习一点点就知道有多么的强大,多么的有用了。而且,正则表达式跟语言无关,什么语言都能用得到,学这个不亏的。
标准C库中没有正则表达式相关的函数,一般来说C中使用两种正则表达式库,一为POSIX C正则库,二为perl正则库PCRE。相比较而言PCRE要强大些,POSIX C正则库就足够使用。
下面,这几个链接里面有网页分析的一些例子,虽然不都是C语言来处理的。但是,思路都是一致的。 所以,说到底,还是正则表达式、正则函数库、字符串处理函数这些才是根本。先说这些,希望对你有所帮助。如果你在学习过程中还有什么问题,欢迎随时交流:)
C#的: http://www.jb51.net/article/16618.htm
C#的: http://mytiu.blog.163.com/blog/static/1059718452009127112226478/
这里还有一段C语言的代码, 是将下载下来的网页源代码处理成没有标签的纯文字文本
#include <tidy.h>
#include <buffio.h>
#include <stdio.h>
#include <errno.h>
int main(int argc, char **argv )
{
const char* input = "<title>Foo</title><p>Foo!";
TidyBuffer output = {0};
TidyBuffer errbuf = {0};
int rc = -1;
Bool ok;
TidyDoc tdoc = tidyCreate(); // Initialize "document"
printf( "Tidying:\t%s\n", input );
ok = tidyOptSetBool( tdoc, TidyXhtmlOut, yes ); // Convert to XHTML
if ( ok )
rc = tidySetErrorBuffer( tdoc, &errbuf ); // Capture diagnostics
if ( rc >= 0 )
rc = tidyParseString( tdoc, input ); // Parse the input
if ( rc >= 0 )
rc = tidyCleanAndRepair( tdoc ); // Tidy it up!
if ( rc >= 0 )
rc = tidyRunDiagnostics( tdoc ); // Kvetch
if ( rc > 1 ) // If error, force output.
rc = ( tidyOptSetBool(tdoc, TidyForceOutput, yes) ? rc : -1 );
if ( rc >= 0 )
rc = tidySaveBuffer( tdoc, &output ); // Pretty Print
if ( rc >= 0 )
{
if ( rc > 0 )
printf( "\nDiagnostics:\n\n%s", errbuf.bp );
printf( "\nAnd here is the result:\n\n%s", output.bp );
}
else
printf( "A severe error (%d) occurred.\n", rc );
tidyBufFree( &output );
tidyBufFree( &errbuf );
tidyRelease( tdoc );
return rc;
}