<?php
//取得指定位址的內容,並儲存至text
$text=file_get_contents('aa.htm');
//取得所有img標簽,並儲存至二維陣列match
preg_match_all('#<img\s+src="(.*?)"[^>]*>#i', $text, $match);
//印出match
echo implode($match[1],"<br>\n");
?>
2. PHP提取文字
這個有點像讀取圖片驗證碼
記得以前有人寫過,不過只是針對某個特定網站特定圖片樣式寫的。
大概原理:
圖片的文字是無法直接讀取,通過讀取圖片像素模糊判斷是可以的。
先是讀取圖片,然後根據圖片,調整一下對比度(網上有程序代碼),讓圖片的文字更突出,背景更淡化。
然後嵌套循環,每行每列讀取圖片像素,找出規律對比一下。
判斷圖片字元。
ps:這個規律得有個好的演算法和思路
比如文字「一」
讀出的像素數組可能是在
a[5,4] a[6,4] a[7,4] a[8,4] a[9,4] a[10,4]
這些地方有顏色,而且顏色大概相同,
你再建個字元規律庫,「一」的可能是 1,1,1,1,1,1,1
兩個通過轉換演算法相互對比一下,如果大概符合,就可以判斷是字元「一」。
誤差會有的,就算官方的掃描程序也會認錯字。
我只隨便說一下,不一定正確。你可以在網站搜下相關東西。
3. PHP能夠實現圖片轉文字的功能嗎如果可以的話能告訴一下思路和需要用到的函數
不能,且不說OCR這種庫在PHP里根本無法調用,就算找到介面目前OCR的識別率和識別速度都是杯具,標准文字正常排列還經常會掃錯,稍微有點變體或者摻雜點格式和英文字元就徹底完了。
4. php content內容裡面有圖片和文字,只想提取文字顯示在頁面,急求!!詳細代碼!
直接有清除某類html代碼的函數的,不用正則
<?php
$text = '<p>Test paragraph.</p><!-- Comment --> <a href="#fragment">Other text</a>';
echo strip_tags($text);
echo "\n";
// 允許 <p> 和 <a>
echo strip_tags($text, '<p><a>');
?>
5. PHP字元串提取一段文字中的img代碼
用正則吧。
上面的朋友已經問答了,我補充你的第二問:
只得到裡面的 images/new/h1.jpg
-----------------------------
<?php
$str='「歡迎查看美女圖片<img src="images/new/h1.jpg" width="450" height="210" />哈哈」';
preg_match_all('/src="(.*)"/iUs', $str, $out);
$img=$out[1][0];
echo $img;
?>
6. 如何用PHP識別一張圖片的某一處位置(圖片相當於背景)。然後在這個位置可以編輯文字,然後列印(PDF)
使用php
位置沒有辦法自動識別,但可以指定,例如可以指定x和y軸(20,25)
7. 請問php有辦法識別一張圖片色塊分布嗎比如找出最適合添加文字的地方
理論上肯定是可以的。不過這應該是一個很高深的東西。所以,我只能給你我很粗淺的方法:
一:寫個函數,這個函數的主要功能是找出一張圖片上的主要顏色(代碼在最後面)
二:把一張圖片有GD庫分成9份(3*3)或更多份,然後用第一個函數來取得每一份小圖的主要顏色。
三:比對這幾份小圖的顏色,看哪一份的顏色是你需要的。
如果你原意,你也可以切很多份,比如10000份(100*100),然後計算這10000個顏色的中你需要的顏色的分布,找出你需要的區域。
$i = imagecreatefromjpeg("image.jpg");
for ($x=0;$x<imagesx($i);$x++) {
for ($y=0;$y<imagesy($i);$y++) {
$rgb = imagecolorat($i,$x,$y);
$r = ($rgb >> 16) & 0xFF;
$g = ($rgb >> & 0xFF;
$b = $rgb & 0xFF;
$rTotal += $r;
$gTotal += $g;
$bTotal += $b;
$total++;
}
}
$rAverage = round($rTotal/$total);
$gAverage = round($gTotal/$total);
$bAverage = round($bTotal/$total);
8. PHP 只想讀取出文字不想讀取出圖片
php 內置函數 strip_tags
9. 怎麼用PHP解析出圖片上的文字,然後和相應的數據對比,比如
PHP不適合做OCR圖片識別,效率太低,也沒有現成的類庫~
建議改用其他語言來識別,PHP再去調用