視覺提示新突破！IDEA研究院發布T-Rex模型解鎖「一圖勝千言」的Prompting新體驗 - 香港商報

香港商報WAP版

香港商報APP客戶端

香港商報融媒體矩陣

融媒體矩陣

香港商報微信視頻號

微信視頻號

香港商報快手視頻號

快手視頻號

香港商報今日頭條

今日頭條

香港商報郵箱

郵箱

zgc_west@126.com 复制

訂報/續訂 | 廣告服務 | PDF電子報 | 電子報

香港商報Youtube

香港商報Instagram

香港商報微博

香港商報微信公眾號

香港商報微信公眾號

首頁港聞財經商聯通視聽港深合作評論綜合灣區社團 Life Style 地方新界專刊專題

香港商報

--℃

滾動新聞：

視覺提示新突破！IDEA研究院發布T-Rex模型解鎖「一圖勝千言」的Prompting新體驗20:07 深圳首艘3000噸級海洋執法船入列首次亮相國際海洋周20:06 港燈首次到深圳招聘深受求職者歡迎20:01 深圳調整二套住房最低首付款比例最低為40%19:51 3人涉詐騙社署及保險公司逾90萬遭廉署起訴周五提堂19:48 深圳調整享受優惠政策普通住房認定標準19:44 【收藏「琪」觀】森羅萬象19:42 孫玉菡率團在深圳出席多項活動推廣香港大灣區人才服務港角色19:40

視覺提示新突破！IDEA研究院發布T-Rex模型解鎖「一圖勝千言」的Prompting新體驗

視覺提示新突破！IDEA研究院發布T-Rex模型解鎖「一圖勝千言」的Prompting新體驗

責任編輯：朱劍明 2023-11-22 20:07:59 來源：香港商報網

　繼火爆出圈的Grounded SAM之後，IDEA研究院團隊攜重磅新作歸來：全新視覺提示(Visual Prompt)模型T-Rex，以圖識圖，開箱即用，開啟開集檢測新天地!

QQ截图20231122201315.jpg

　(動態圖)

QQ截图20231122201324.jpg

　(靜態圖)

　拉框、檢測、完成!在剛剛結束的2023 IDEA大會上，IDEA研究院創院理事長、美國國家工程院外籍院士沈向洋展示了基於視覺提示的目標檢測新體驗，並發布了全新視覺提示模型T-Rex的模型實驗室(playground), Interactive Visual Prompt(iVP)，掀起現場一波試玩小高潮。

　在iVP上，用戶可以親自解鎖「一圖勝千言」的prompting體驗：在圖片上標記感興趣的對象，向模型提供視覺示例，模型隨即檢測出目標圖片中與之相似的所有實例。整套流程交互便捷，只需幾步操作就可輕鬆完成。

QQ图片20231122201435.png

　(動態圖)

QQ图片20231122201445.png

　(靜態圖)

　IDEA研究院4月份發布的Grounded SAM (Grounding DINO + SAM) 曾在Github上火爆出圈，至今已狂攬11K星。有別於只支持文字提示的Grounded SAM，此次發布的T-Rex模型提供着重打造強交互的視覺提示功能。

　T-Rex具備極強的開箱即用特性，無需重新訓練或微調，即可檢測模型在訓練階段從未見過的物體。該模型不僅可應用於包括計數在內的所有檢測類任務，還為智能交互標註場景提供新的解決方案。

QQ图片20231122201522.png

　團隊透露，研發視覺提示技術是源自對真實場景中痛點的觀察。有合作方希望利用視覺模型對卡車上的貨物數量進行統計，然而，僅通過文字提示，模型無法單獨識別出每一個貨物。其原因是工業場景中的物體在日常生活中較為罕見，難以用語言描述。在此情況下，視覺提示顯然是更高效的方法。與此同時，直觀的視覺反饋與強交互性，也有助於提升檢測的效率與精準度。

　基於對實際使用需求的洞察，團隊將T-Rex設計成可接受多個視覺提示的模型，且具備跨圖提示能力。除了最基本的單輪提示模式，目前模型還支持以下三種進階模式。

QQ图片20231122201543.png

　• 多輪正例模式：適用於視覺提示不夠精準造成漏檢的場景

　• 正例+負例模式：適用於視覺提示帶有二義性造成誤檢的場景

　• 跨圖模式：適用於通過單張參考圖提示檢測他圖的場景

　在同期發布的技術報告中，團隊總結了T-Rex模型的四大特性：

QQ图片20231122201613.png

　開放集：不受預定義類別限制，具有檢測一切物體的能力

　視覺提示：利用視覺示例指定檢測目標，克服罕見、複雜物體難以用文字充分表達的問題，提高提示效率

　直觀的視覺反饋：提供邊界框等直觀視覺反饋，幫助用戶高效評估檢測結果

　交互性：用戶便捷參與檢測過程，對模型結果進行糾錯

　研究團隊指出，在目標檢測場景中，視覺提示的加入能夠補足文本提示的部分缺陷。未來，兩者的結合將進一步釋放CV技術在更多垂直領域的落地潛能。

　有關T-Rex模型的技術細節，請參考同期發布的技術報告。

QQ图片20231122201624.png

　iVP 模型實驗室：https://deepdataspace.com/playground/ivp

　Github連結：trex-counting.github.io

　本項工作來自IDEA研究院計算機視覺與機械人研究中心。該團隊此前開源的目標檢測模型DINO是首個在COCO目標檢測上取得榜單第一的DETR類模型;在Github上大火的零樣本檢測器Grounding DINO與能夠檢測、分割一切的Grounded SAM，同樣為該團隊作品。

責任編輯：朱劍明

視覺提示新突破！IDEA研究院發布T-Rex模型解鎖「一圖勝千言」的Prompting新體驗

推薦新聞

深圳調整二套住房最低首付款比例最低為40%

深圳調整二套住房最低首付款比例最低為40%

馬雲拋售巨額股票？阿里回應

朱民：明年世界經濟將是「平庸之年」

朱民：明年世界經濟將是「平庸之年」

巴菲特再捐8.66億美元股票指旗下投資旗艦巴郡已有合適繼任人

巴菲特再捐8.66億美元股票指旗下投資旗艦巴郡已有合適繼任人

OpenAI：與阿爾特曼原則上達成復職協議組建新董事會

OpenAI：與阿爾特曼原則上達成復職協議組建新董事會

熱門排行

24小時

7天

2023年粵港澳大灣區主流媒體貴港行活動啟動有片 | 炎明熹將為考試「閉關」盼假期與家人相聚【社團發聲】善用神聖一票建設美好家園尖沙咀舖租續冠亞太機構：本港一線街舖復蘇仍有韌性房協第五個資助盤「朗然」11·30接受申請市價六二折推售都大首辦流感疫苗接種日維持安全健康校園環境廣東推進「數字灣區」建設深入對接港澳打造全球數字化水平最灣區百仁基金轉型推動青少年STEAM教育聯同其他機構舉辦少年創科達人大獎七旬老婦攀窗企圖跳樓消防飛將軍游繩救脫險警方拘捕遊蕩男子涉假扮女學生闖中學

有片｜【娛樂】黎明演唱會雷射天幕配「明曲」震撼觀眾創科高才招聘會舉辦吸引逾300名新來港高才參加有片 | 香港內地文學名家與深圳學子共讀共談深二實大講堂名家點亮校園【商報時評】升級香港遊多搞新意思習近平在美國友好團體聯合歡迎宴會上的演講（全文）儷芬科技在冀啟動服裝產業園項目暨全球招商中心揭牌楊何蓓茵︰逾500名非公務員僱員拒宣誓全部已離職嶺南大學代表隊在全美銷售大賽中勇奪國際大獎為港爭光【藝術】「融墨之美」藝術沙龍交流會在港舉行逐夢，「圳」「崇」這裏出發

香港商報PDF

股市

友情鏈接

香港政府新聞網 | 商務部 | 香港貿易發展局 | 香港旅遊發展局 | 香港立法會 | 香港廉政公署 | 香港申述專員公署 | 大公文匯網 | 星島環球網 | 香港新聞網 | 紫荊網

關於我們 - 聯絡我們 - 版權聲明 - 法律聲明 - 廣告服務 - 網上訂報 - 記者證查詢

承印人、出版人：香港商報有限公司 香港商報有限公司版權所有，未經授權，不得複製或轉載。 Copyright © All Rights Reserved

香港商報Youtube

香港商報Instagram

香港商報微博

香港商報微信公眾號

香港商報微信公眾號

聯絡我們

電話：（香港）852-2564 0768

（深圳）86-755-83518792 83517835 83518291

地址：香港九龍觀塘道332號香港商報大廈