源碼截取
1. 如何從原網頁的代碼中截取自己想要的內容
你是要截取網頁裡面某一單元的內容么?如果只是單網頁內容簡單的,可以直接查看源代碼復制,不然就得寫規則,後端運行爬取,具體看你想要的內容情況了
2. 請問網站的視頻鏈接源碼怎樣提取
最簡單的方法,火狐或者CHROME瀏覽器打開視頻頁面按F12,瀏覽器會彈出開發窗口,點擊網路,選擇媒體即可查看視頻源,很多視頻源都是防盜鏈的,一般可能不可以用迅雷等等下載。
3. java截取網頁源代碼,高分送上!
test.html:
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=GB18030">
<title>Insert title here</title>
</head>
<body>
<div class="neirong">
《瘋狂android講義》
<br />
第1章 android應用與開發環境1
<br />
1.1 android的發展和歷史2
<br />
1.1.1 android的發展和簡介2
<br />
1.1.2 android平台架構及特性3
<br />
....................
</div>
<div class="read-more">more1</div>
<div class="read-more">more2</div>
</body>
</html>
java:
// 獲取網頁內容
URL url = Test1.class.getResource("test.html");
StringBuffer sbf = new StringBuffer();
try {
URLConnection uc = url.openConnection();
uc.connect();
InputStream in = uc.getInputStream();
BufferedReader br = new BufferedReader(new InputStreamReader(in));
String temp = null;
while ((temp = br.readLine()) != null) {
sbf.append(temp);
}
br.close();
in.close();
System.out.println(sbf.toString());
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
System.out.println("解析。。。");
// 解析網頁內容
String p1 = "<div class=\"neirong\">(.*?)(?=</div>)";
Pattern p = Pattern.compile(p1);
Matcher matcher = p.matcher(sbf.toString());
if (matcher.find()) {
String innerDiv = matcher.group(1);
String[] strs = innerDiv.split("<br\\s*/>");
for (String str : strs) {
System.out.println(str);
}
}
4. js截取指定網頁的指定源碼怎麼做,如果不能跨域。另外一個問題,asp頁面怎麼include aspx頁面。
js 沒辦法跨域截取指定網頁的內容,不過可以考慮在後台(asp或asp.net)發送請求,取得目標網頁的HTML碼,再回到js中做處理,不過後台處理能力更強。
第二個問題,可以考慮在asp中用 Iframe 載入aspx頁面,不可以include
5. 求截取該flash小游戲的源代碼的方法,萬分感激!!!
那是因為你flash
播放器沒安裝,或者
版本低了,打開
http://games.ruopo.com
移動到最下面,有個
flash
播放器下載,下載了就行了。
下載方法:
打開游戲後,在游戲框外面有個「下載游戲」點它下載就行了~
要論壇本身自帶
flash
模塊,只要有了
flash
模塊,下一步就是找到你喜歡的那個小游戲
flash
SWF
格式的
網址,
例如
打開
http://games.ruopo.com
找到你喜歡的小游戲,點
游戲頁面
後在游戲框
外面
有個
分享此游戲,
點它,把
帶
swf
格式的網址復制起來,(一般這個網站第2個就是
swf
地址),跟著
打開你要上傳的那個論壇
,新建
模塊,把剛剛復制的那個SWF網址
復制進去就行了。
打開
你想要的
小游戲頁面
如
http://games.ruopo.com
,選擇你喜歡的小游戲,跟著在游戲框外面有個
分享此游戲,點它,把帶
SWF
格式的
地址
復制下來,
然後在打開
QQ空間,新建一個
flash
模塊,把剛剛那個地址復制進去。
例如
打開http://games.ruopo.com
你想要下載的小游戲頁面,在游戲框外面有個「下載游戲」點它下載就行了~
我教你如何
知道
任何小游戲
SWF
格式地址。
.
先說說
這個網站
http://games.ruopo.com
這個網站
所有的
flash
游戲都可以下載,打開游戲頁面
,跟著在游戲框
外面
有個分享此游戲
,點它,第2個
就是
SWF
格式的地址了~
.
要是其它網站,你就右鍵
那個
游戲頁面,
查看源文件,
跟著
Ctrl+
F
,輸入
swf
,你點
下一步。
看到
帶
SWF
那些代碼沒?
看著那個符合
游戲的,就把那個復制起來。
找到你想要的小游戲的flash
地址後,打開空間,跟著新建一個
flash
模塊,把那個帶
SWF
格式的小游戲地址復制進去就行了~
.
例如
在
http://games.ruopo.com
中
,我選擇了自己喜歡的一款游戲,在游戲頁面有個「分享此游戲」
點它,把
帶
SWF
格式的小游戲網址復制起來,轉到空間flash模塊中提交就行了。
你點擊頁面-工具
Internet
選項-游覽歷史記錄(這個范圍內點那個
設置,中間那有個
當前位置,看到沒,那個
C:***
的就是了,不過很多的,你要找的時候,盡量用知道的途徑找,例如,我要找金庸小游戲緩存文件,那我就會有
Ctrl+F,跟著輸入金庸小游戲,這樣就能更快的找到自己想要的那個緩存文件了)
.
希望我知道的能幫到你
6. php如何快速獲取其它網頁的html源碼,如何截取某一特定部分
$url = "http://20.08.cn/?beijing";
$r = file_get_contents($url);
下面用證則表達式。。替換即可!
7. VBS 中針對網頁源碼特定字元截取的函數問題
提取這些代碼用你說的那兩個函數是可以實現的不過有點麻煩,可以只用正則表達式,如下:
'══代══碼══開══始════
set fso=CreateObject("Scripting.FileSystemObject")
set ws=CreateObject("wscript.shell")
set fr=fso.opentextfile("123.txt",1)
call getdata(fr.readall)
function getdata(byval data)
set regex=new regexp
regex.global=true
regex.ignorecase=true
regex.Pattern="(標識開始.*\n)(.*|\n)*(?=\n.*標識結束)"
Set Matches = regEx.Execute(data)
if Matches.count<>0 then
msgbox Matches(0)
end if
end function
'Coded By escortmnm from VBS團隊
'══代══碼══結══束════
我測試用的文本保存在同目錄下面的「123.txt」裡面,內容是
'══內容開始════
在電腦本地通過InternetExplorer.Application對象已將目標網頁源碼保存在本地TXT文本里,但是需要提取的內容卻包含在一段有標識符的代碼里,示例如下:
……………很多無用的源碼……………
<!-- item_nav_list --> '標識開始
…………需要提取的源碼,很多行……
<!--/ item_nav_list --> '標識結束
…………無用的源碼到文本尾…………
(標識在文本中是唯一的)
有人建議用InStr配合Mid使用,有人建議用split函數,但實不知該怎樣調用這些函數,請教……
'══內容結束════
說明,你自己測試一下,出現錯誤或者問題hi我。或者你將你的網頁的網址發過來,我直接處理好。
補充回答:
'══代══碼══開══始════
set fso=CreateObject("Scripting.FileSystemObject")
set fr=fso.opentextfile("123.txt",1)
set fw=fso.createtextfile("temp.txt",2)
data=fr.readall
set regex=new regexp
regex.global=true
regex.ignorecase=true
regex.Pattern="id=[0-9]*(?=.*劉先生[^0-9])"
Set Matches = regEx.Execute(data)
msgbox Matches(0)
fw.writeline mid(Matches(0),4)
fw.close:fr.close
set fw=fso.opentextfile("123.txt",2)
set fr=fso.opentextfile("temp.txt",1)
fw.write fr.readall
fw.close:fr.close
fso.deletefile "temp.txt",true
msgbox "OK,Please Open Your File!",64,"Notice"
'Coded By escortmnm from VBS團隊
'══代══碼══結══束════
8. 如何把網頁源代碼截取呢
用字元串函數
例如
Substring
string str="abcdefg";
string str1=str.Substring(2,3);//str1="cde"
先找<title> 位置即可
9. 如何截取APS網站整站源碼
一般別人發布的時候就沒把源碼發布,你怎麼去裁取呢,只有腳本你可以看到.在網頁任意位置右擊-查看源文件可以看到後台腳本的.
10. 如何通過網頁源代碼來提取網頁中的圖片
可以現在網頁源碼中找到圖片的鏈接,然後將圖片在新窗口打開並進行保存。
1、右擊想要提取的圖片,在展開的菜單中點擊「檢查」按鈕打開控制台: