淘宝网站源码php
PHP实现采集抓取淘宝网单个商品信息,本文是一种实现思路,使用file_get_contents函数实现,并给出了采集正则,需要的朋友可以参考下
调用淘宝的数据可以使用淘宝提供的api,如果只需调用淘宝商品图片名称等公开信息在自己网站上,使用php中的 file_get_contents 函数实现即可。
思路:
file_get_contents(url) 该函数根据 url 如 http://www..com 将该网页内容(源码)以字符串形式输出(一个整字符串),然后配合preg_match,preg_replace等这些正则表达式操作就可以实现获取该url特定div,img等信息了。当然前题是淘宝在单个商品页面的结构是固定的,如500图的img中id就是J_ImgBooth!
具体实现方法:(获取500图,名称,价格,属性及商品描述)
复制代码 代码如下:
$text=file_get_contents("http://item.taobao.com/item.htm?id=2380347279"); //将url地址上页面内容保存进$text
A.获取500图:
复制代码 代码如下:
preg_match('/<img[^>]*id="J_ImgBooth"[^r]*rc=\"([^"]*)\"[^>]*>/', $text, $img);
//运用正则抓取img标签中id为J_ImgBooth的img,$img[0]为该500图img标签,$img[1]为500图的图片地址;
B. 获取名称:
复制代码 代码如下:
preg_match('/<title>([^<>]*)<\/title>/', $text, $title);
//因为正文中的商品名称标签没有特殊class或id正则不好抓取,就抓<title>标签中的内容了,一般来说title中内容就是商品名称了(实际有些出入),$title[0]整个title标签 $title[1]标签中内容;
$title=iconv('GBK','UTF-8',$title);
//如果你的网站是utf8编码,那么需要进行一下转码(淘宝是gbk编码)
C.获取价格:
复制代码 代码如下:
preg_match('/<([a-z]+)[^i]*id=\"J_StrPrice\"[^>]*>([^<]*)<\/\\1>/is', $text, $price);
//同理获取id为J_StrPrice的标签内容$price[2], $price[0]是整个标签, $price[1]为strong标签名;
$price=floatval($price);//放入数据库估计还有转一下变量类型
D.获取属性:
这之前获取的内容都是在单标签中相对只需一个正则就可搞定,然而如果要获取如
复制代码 代码如下:
…
<div id=”xxx”>
…
<ul>
…
</ul>
<div>…
<div>…
</div>
</div>
</div>
…
这样特定div中有未知n个<>标签,获取该特定div将会非常的困难,搜了下网上,最接近的也只是”/<([a-z]+)[^>]*>([^<>]|(?R))*<\/\\1>/”这样使用递归抓取标签对,但是他不能抓特定标签,所以想要轻松抓取class=”attributes”的div我是没法办到了。但是淘宝网页有其特殊性,就是它的各个标签结构基本是固定的…<div>…</div>标签后面不是</div><div id=”description”>就是</div><div>,所以我们可以采用变通法达到获取属性标签内容的目的。
复制代码 代码如下:
preg_match('/<(div)[^c]*class=\"attributes\"[^>]*>.*<\/\\1>/is', $text, $text0);
//这个正则会抓取<div开始到整个页面最后一个</div>标签,当然我们属性标签就在这个的前面部分。
$text1=preg_replace("/<\/div>[^<]*<(div)[^c]*id=\"description\"[^>]*>.*<\/\\1>/is","",$text0);
//匹配到</div ><div id=”description”>至最后</div>然后用””代替(就是把匹配的删除了),所以如果attributes的div后面紧跟的是description那么我们已经达到目的了。
$attributes=preg_replace("/<\/div>[^<]*<(div)[^c]*class=\"box J_TBox\"[^>]*>.*<\/\\1>/is","",$text1);
//如果attributes后面紧跟box J_Tbox标签,那么我们还需要使用以上这步来剔除box J_Tbox标签,当然如果attributes的div后面紧跟的是description,这一步将不会匹配到任何即什么都不会做。
E.获取描述:
通过上面方法你肯定觉得淘宝页面上任何标签都可以很简单获取了吧(我之前也是这么想的),但是使用这个方法获取描述时得到的内容将会是“描述加载中”,是的,这个描述内容不是在源码中的,它是打开页面加载进一大堆js后,不知道从淘宝的哪个角落中加载进来的。
好吧,那么我们也可以模仿它放一些js进去。不知道哪些对加载描述有用?没事,全加载进来肯定没错。不知道需要放那些特定div上去有作用?抓一个源码,删掉一些div一步步试试看,你会发现“<div id=”detail”> </div>
复制代码 代码如下:
<div id="description">
<div id="J_DivItemDesc">描述加载中</div>
</div>
这几个div是加载描述所必须的,那么下面就是写代码了:
复制代码 代码如下:
preg_match_all('/<script[^>]*>[^<]*<\/script>/is', $text, $content);//页面js脚本
$content=$content[0];
$description='<div id="detail"> </div>
<div id="description">
<div id="J_DivItemDesc">描述加载中</div>
</div>';
foreach ($content as &$v){$description.=iconv('GBK','UTF-8',$v);};
//将这个$description放进页面,描述就会自动的加载进来了,当然多个商品描述在同一个页面也会只有一个描述会被加载的。
② 如何在淘宝网的网页源代码中插入其它的代码
进入我的淘宝首页,管理我的店铺,在基本介绍里,复制粘贴进店铺介绍或店铺公告都行
文字移动代码:
代码:<marquee>添加你想添加的字就行了</marquee>
</marquee>是一对控制文字滚动的代码,放在它们之间的文字显示出来的效果就是从右到左移动。代码中间的字可以换成自己想要的字
促销区图片超链接的代码:
<a href="商品地址"><img alt="" src="图片地址" /></a>
移动+超链接的代码:
<marquee><a href="商品地址"><img alt="" src="图片地址" /></a></marquee>
如果想插入多图,就多添加几个代码:<a href="商品地址"><img alt="" src="图片地址" /></a><a href="商品地址"><img alt="" src="图片地址" /></a> 反正一个代码代表一张图,如果使多图既可以移动,只要加上<marquee></marquee>这个组合就行啦!
举例:<marquee><a href="商品地址"><img alt="" src="图片地址" /></a><a href="商品地址"><img alt="" src="图片地址" /><a href="商品地址"><img alt="" src="图片地址" /><a href="商品地址"><img alt="" src="图片地址" /><a href="商品地址"><img alt="" src="图片地址" /></a></marquee>
上面就是在促销区添加5张可以移动+超链接的代码.
补充说明一下:淘宝好像不支持链接店铺图片的,所以要链接的图片,最好就是淘宝支持的相册才行,不然图片是没办法显示出来的哦~
店铺装修代码
1、店铺音乐代码:音乐网址" loop="-1">
2、图片制作代码:<img src="这里放图片地址">
3、公告图片代码:<img border="0" src="这里放图片地址" />或<img src="这里放图片地址"/>
4、悬浮挂饰代码:<img src="这里放图片地址" style="left:20px; position: relative; top:0px" />
5、商品分类代码:<img src="这里放图片地址"/>
6、字体大小代码:<font size="2">这里放要处理的文字,可用3、4、5等设置大小</font>
7、字体颜色代码:<font color="red">这里放要处理的文字,可以换成blue,yellow等</font>
8、文字链接代码:<a href="网页地址">链接的文字,在分类栏里用时链接的网页地址必须缩短</a>
9、移动文字代码:<marquee>从右到左移动的文字</marquee>
10、背景音乐代码:<bgsound loop="-1" src="这里放音乐地址"></bgsound>
11、图片附加音乐代码:<img border=0 src="这里放图片地址" dynsrc="这里放音乐地址">
、浮动图片代码:<img alt="1" height="150" src="这里放图片地址"/>
公告图片的代码:公告挂饰:店铺分类代码:背景音乐代码:换行代码
黄河
③ 商城网站源码是用PHP开发的好用吗
最近了解到目前,随着电子商务产业的快速发展,网上商城系统成本低,速度快等优势为众多企业带来了机遇,营销功能丰富,商品系统完善,用户体验良好。 那么php商城系统开源的主要特征是什么?
1,php开源商城系统更方便
PHP程序快速开发,运行速度快,技术本身可以快速学习。嵌入HTML:因为PHP可以嵌入HTML语言,所以它与其他语言相关。编辑简单,实用,然后满足企业发展需要的功能,或增加企业的新需求;
2,php开源商城系统适应性强
选择开源商城系统,公司可以访问源代码,可以根据自己的意愿修改开源商城系统,降低此类风险,因为在开源社区中会有不断的维护和更新流。因此,受到各行各业中小企业的欢迎和广泛使用,使开源商城软件的适应性更强;
3,php开源商城系统强大的跨平台
由于PHP是服务器端脚本,因此它可以在UNIX,LINUX,WINDOWS,iOS和Android等平台上运行;
4,php开源商城系统效率更高
效率是每个用户在选择商城系统时将考虑的问题。 PHP mall系统消耗相对较少的系统资源。
5,php开源商城系统更安全
安全是每个用户在选择电子商务系统时会考虑的第一个问题,因为开源商城系统的源代码是开放的并且没有得到很好的保护,用户将认为开源商城系统的安全性是不可靠的。然而,随着电子商务系统开发技术的成熟,对开源商城系统的研究也取得了很大进展。有特殊的人来解决电子商务系统的BUG等问题。因此,开源商城系统的安全性能不断提高。
商城系统应该具有的特点:
1、消费者购物非常的方便,可以直接在线上下订单。比如团长和消费者可以直接在团购系统中下订单;
2、如果消费者想要增加一些收益,就可以申请成为团长,团长作为自己的一份兼职,可以给自己带来一部分收益;
3、可设置商品抢购时间段,限购数量,商品分类,商品描述,库存设置,购物车等。
4、团长可推荐团长,团长可推荐消费者,消费者也可推荐消费者(关系链自动绑定/自定义佣金比例),这样团长也不用担心自己的客户流失。
5、数据系统化(订单/款项/配送/关系链/佣金)等,减少了公司和团长工作量,避免了财务和订单出错。
6、管理后台:团长(自提点)信息的添加/删除/审核;商品上下架;消费者信息管理,订单数据统计管理,配送管理等。
7、可直接导出或打印“某个小区/某个时间段/不同商品的销售数量”,并依此数据可直接进行货品配送。
8、每个团长都可在平台上查看自己小区的经营状况(消费者下单明细/自己的佣金明细/自己的下线明细/自己的订单明细等)。
9、商家可以设置商品的抢购段,吸引更多人的关注,比如商家可以推出限购活动,消费者在了解了活动的详情以及产品信息之后,只要比较感兴趣,就可以直接将产品收进自己的购物车。通过开展抢购活动,可以吸引更多用户关注商城团购系统。
10、每一个团购都有一个团长,团长也可以推荐其他社区的人成为团长,班长也可以推荐消费者,消费者也可以推荐其他的消费者,这样团长就不用担心消费者流失了。
11、商家有了商城系统之后,可以对订单数据进行快速的处理,减少了公司和团长的工作量,同时也能够避免在财务和订单方面出现问题。
总的来说,一个好的商城系统通过用户的主动分享,口碑传播效应,让你的推广成本直线下降,推广速度倍增,粉丝迅速累积,还能获得即时资金,订单量暴增,门店引流等等作用!这种模式从整体上解决了原来传统方式的流量问题、推广成本高昂问题、0库存问题、损耗问题、资金压力等等问题。
④ 淘宝网为什么是用PHP程序开发
从用户的角度讲:PHP的开发成本低,速度较快,比用ASP和JSP的开发性价比高。 从技术的角度讲: PHP是一个很优秀的工具,它可以简单,也可以复杂。不一样的项目,应该用不一样的PHP。小项目 - 简单而直接的PHP 一般对于一个功能页面在20以下的网站,我们可以用一个很简单的框架结构来写。在这个规模上,我建议是使用比较直接的面向过程编码方法,原因很简单,没有必要把class文件弄的N 多,结果controller里边就一个new就完了。当然,需求频繁变化的项目除外。
在这个级别上,php优点表现的很明显:快速开发,一目了然。缺点同时也被隐藏得很好。 中型项目 - 结构优美的面向对象化的PHP 对于一个中型项目,我建议使用一个良好设计的框架来做,这个框架可以是基于MVC模型,封装了众多底层操作的,当然,一定要有一个好的最好是透明的cache机制,这样,我们为了适应变化而加入的OO机制可以运行得更快更好。 在这个级别上。php的缺点开始凸现,像对OO支持的不完整(这个PHP5有很大改进),只能单线程模式。另外一些外围工具开始出现缺乏支持,像PHP没有好的重构工具,没有好的集成到IDE中的单元测试工具。优点当然还是原来的快速开发,广泛的可用的开源资源。 大型项目 - 扩展、优化后的PHP 这里的大型项目,简单的指分布式项目,就是说,你的程序需要被部署在N台服务器上了。在这个层级上,PHP比起J2EE的确缺乏很多支持。我曾和shadow在735上详细讨论过PHP要在大型系统上应用需要解决的一些问题,当然这些问题不光是PHP这个语言的问题,也包括了周边开发的问题: 1 PHP的页面代码共享,PHP的源代码被载入内存一次以后,就在其中保留 - 这个用APC和Zend的优化器可以搞定。 2 PHP页面之间的数据对象共享,a.php和b.php之间可以共享一个数据对象,比如数组,这个现在可以用序列化来作,但是会有文件io,这块可以用共享内存或者memcached来处理。 3 PHP的数据库连接池,因为在多前端的情况下,PHP控制不住对数据库的连接,所以需要在数据库前边去作一个连接池,类似于sqlrelay的东西。另外数据缓存也是很重要的,大压力开发有一个tip,就是能不动数据库就不要动数据库。 4 PHP的前端cache系统。一个透明的可控制的cache机制,确保网站的页面以最少次数查询数据库。这个有很多实现,但是没有找到特别好的。 5 一个PHP应用,成功的解决调这几个问题以后,应付稍微大一点的压力是没有什么问题的。 在这个级别上,重要的是,把PHP Java C++ python之类融合起来,使其成为一个高效系统。我们可以用memcached来做分布式内存管理,可以用Lucene 来作全文检索,用EJB 容器来放一些业务逻辑组件,PHP则作为前端和系统的胶水,快速而灵活的把这些粘合起来。
⑤ 淘宝网用什么代码开发的ASP,PHP,ASP.NET
JSP把,JSP安全性高,向淘宝这样涉及资金交易的应该是JSP,而且有次看到淘宝报错也是JSP的