• <u id="mswwc"></u><object id="mswwc"></object>
  • <div id="mswwc"><code id="mswwc"></code></div>
  • 首頁 > 業界 > 關鍵詞  > 愛奇藝最新資訊  > 正文

    AI視野:WPS AI宣布接入WPS Mac版;愛奇藝推出AI搜索;蘋果計劃明年推出生成式AI功能;DALL-E3易受越獄攻擊

    2023-10-23 14:56 · 稿源:站長之家

    ??????AI應用

    愛奇藝推出AI搜索 將生成式AI技術應用于劇情搜索等場景

    愛奇藝升級AI搜索,區別于傳統搜索第一步只能搜到片名,升級后的愛奇藝AI搜索主打讓觀眾在搜索環節便能一鍵直達心儀內容。

    【AiBase 提要】

    1. 愛奇藝升級 AI 搜索,讓觀眾一鍵直達心儀內容。

    2. 業內首次將生成式 AI 技術應用于角色搜索、劇情搜索、明星搜索等場景。

    3. 通過搜索建議欄提供豐富的內容推薦。

    WPS AI 宣布接入 WPS Mac 版 提供內容生成等功能

    WPS宣布,Mac版的WPS已經接入了WPS AI,這將帶來內容生成、內容修改和輔助閱讀等功能。

    【AiBase 提要】

    1. WPS 宣布 Mac 版的 WPS 已經接入 WPS AI,提供內容生成、內容修改和輔助閱讀等功能。

    2. 用戶可以通過 WPS AI 一鍵生成文章大綱、講話稿、會議紀要等文件。

    3. WPS AI 基于大語言模型下的生成式人工智能應用,可以幫助用戶生成文檔,并支持多輪話。

    蘋果計劃明年推出生成式AI功能和新版Siri

    蘋果正計劃推出一系列采用生成式人工智能(AI)技術的功能,其中包括新版本的 Siri,預計明年發布。新功能包括重新設計的「Siri」與「信息」應用程序之間的互動,使用戶更有效地處理復雜問題和自動完成句子。

    【AiBase 提要:】

    ??蘋果計劃推出一系列生成式 AI 功能,包括新版本的 Siri,預計明年發布。

    ??蘋果高管正在領導人工智能努力,開發與 AI 深度集成的新版 Siri。

    ??蘋果計劃在各個應用中添加 AI 功能,包括 Apple Music 和生產力應用程序。

    ????????大模型動態

    DeepMind 大模型無法自我糾正推理,除非預設真值標簽

    DeepMind 的研究人員發現,大型語言模型(LLM)在推理任務中無法通過自我糾正獲得更好的回答,除非數據集中預設了真值標簽。這一發現揭示了 LLM 在推理能力上的重大缺陷。

    【AiBase 提要】

    ?? 研究發現 LLM 無法通過自我糾正改善推理回答,除非預設真值標簽。

    ?? 先前的研究中發現,自我糾正改進來自于引入外部信息,而不是模型自身。

    ?? 自我糾正在推理任務中無法提供實質性的改進,且可能導致回答質量下降。

    天貓精靈全面上線 “精靈大模型”

    天貓精靈“精靈大模型”現已全面上線,帶來四大升級技能,包括開放域對話和AIGC創作功能的優化、解決就近喚醒問題以及支持音色切換。

    【AiBase 提要】

    1. 升級技能包括開放域對話和 AIGC 創作功能的優化、解決就近喚醒問題以及支持音色切換。

    2. 全雙工連續對話功能,讓你隨時打斷,無需多次喚醒,帶來無限暢聊體驗。

    3. AIGC 創作功能,讓你通過 AI 靈感創作學富五車,作詩、故事共創都能行。

    中科院國家天文臺開源天文大模型 StarWhisper

    星語 StarWhisper 是一個基于天文大模型 StarGLM 開發的開源項目,旨在提升大模型在天文通用知識和多模態任務上的能力,為未來可部署于望遠鏡陣列的科學具身智能 —— 司天大腦打下基礎。

    image.png

    項目地址:https://github.com/Yu-Yang-Li/StarWhisper

    【AiBase 提要】

    1. 中科院國家天文臺的開源星語 StarWhisper 天文大模型在甲骨文 AI 研究院與 LanguageXAILab 聯合發布的 CG-Eval 上獲得了總排名第二的成績。

    2. 該模型在數學推理和天文能力方面接近或超過了 GPT3.5Turbo。

    3. 星語 StarWhisper 可以通過 AI-wisemodel 平臺下載模型權重后加載,也可以通過 Wenda(聞達)實現多種天文相關的文本處理、知識庫回答、AI 繪畫等任務。

    ??????AI新鮮事

    用GPT-4訓練機器人,英偉達最新Agent開源:任務越復雜越拿手

    英偉達最新AI AgentEureka ,用GPT-4生成獎勵函數,結果教會機器人完成了三十多個復雜任務。比如,快速轉個筆,打開抽屜和柜子、拋球和接球。

    image.png

    【AiBase 提要】

    1. 英偉達的Eureka用GPT-4生成獎勵函數,教會機器人完成30多個復雜任務。

    2. Eureka利用GPT-4的生成能力,通過強化學習訓練機器人控制器。

    3. Eureka在29項基準測試中,83%優于人類設計的獎勵函數。

    AI技術漏洞!OpenAI的DALL-E3易受越獄攻擊 生成兒童吸煙照片

    OpenAI的DALL-E3是一種強大的圖像生成AI技術,但最新的事件表明,它并非沒有漏洞。一位名為Peter Gostev的LinkedIn用戶發現了一種越獄技巧,成功生成了一組令人震驚的圖像,顯示兒童正在吸煙。這一事件引發了對AI系統安全性和道德的擔憂。

    image.png

    【AiBase 提要】

    1. OpenAI 的 DALL-E3,一種圖像生成 AI 技術,被發現容易受到越獄提示的影響,導致生成了兒童吸煙的照片。

    2. 越獄技巧是由 LinkedIn 用戶 Peter Gostev 發現的,他分享了如何成功繞過 AI 的限制來生成有關兒童吸煙的圖像。

    3. 盡管越獄提示相當復雜,但這個事件提醒人們即使是硅谷最富有的公司也難以為其 AI 系統建立全面的防護措施。

    谷歌Pixel8的換臉照片工具引發人工智能操縱爭論

    谷歌最新智能手機Pixel8和Pixel8Pro搭載人工智能功能,可幫助用戶修改照片中的面部表情。這一創新引發了科技界對AI操縱和偽造的擔憂。谷歌官方辯稱這項技術并不“偽造”,而是基于真實時刻創建理想效果。部分專家認為重點是這項AI以創造美好圖像為目的,而非復制現實。

    【AiBase 提要】

    1、谷歌最新智能手機 Pixel8和Pixel8Pro使用AI幫助改變照片中人物的表情,引發操縱人工智能的爭論。

    2、谷歌的新工具被部分評論家形容為“令人毛骨悚然”“詭異”,可能對人們對在線內容的信任造成威脅。

    3、專業攝影師表示,即使出于美學目的,AI操縱也可能導致負面后果,需要謹慎對待。

    HeyGen太牛了!不但讓霉霉說地道中文 而且還能卡點

    這兩天,美國女歌星泰勒?斯威夫特(霉霉)一則說中文的短視頻在各社交平臺火了起來。在視頻里,霉霉操著一口流利、地道的中文,神情自若,幾乎沒有早期譯制片女主角的那種腔調,口型也能對得上。這么看來,AI 配音真的可以「以假亂真、真假難辨」。

    【AiBase 提要】

    1. 美國女歌星霉霉以地道的中文驚艷網友。霉霉在短視頻中展示流利、地道的中文口語。

    3. 視頻作者使用 HeyGen AI 工具實現口型替換。

    4. HeyGen 為用戶提供便宜、省時的視頻制作方法。

    僅5個字符的新繪圖語言火了,ChatGPT都學會了

    只用五個字符,就能完成一幅像素畫的繪制了。這是一種新的繪圖語言,一共支持8種顏色,畫幅可達256*256。它包含了“CFR[]”這五個符號,因此名字也就叫CFR[]了,主打的就是一個直觀。而且CFR[]免費開源,無需部署安裝,在線就能體驗。

    image.png

    傳送門:

    https://susam.net/cfr.html

    GitHub項目頁:

    https://github.com/susam/cfr

    【AiBase 提要:】

    ?? 僅5個字符的新繪圖語言 CFR [] 火了,支持8種顏色,畫幅可達256*256。

    ?? CFR [] 的指令包括 C 代表顏色切換、F 代表向前繪制、R 代表順時針旋轉,以及循環結構的使用。

    ?? CFR [] 繪制出的圖像需要連續,ChatGPT 學會了一部分規則但對循環理解有限。

    新型 AI 算法能在90分鐘內診斷腦腫瘤

    荷蘭研究人員開發了一種算法,叫做Sturgeon,可以在90分鐘內識別出腦瘤的類型。Sturgeon算法依賴于一種新的技術,叫做“納米孔測序”,可以實時地讀出DNA樣本中的堿基序列。

    【AiBase 提要】

    1. 荷蘭研究人員開發了一種名為 Sturgeon 的算法,可以在90分鐘內識別腦瘤的類型。

    2. 該算法依賴于納米孔測序技術,能夠實時讀取 DNA 樣本的堿基序列。

    3. 經過訓練和測試,該算法能在40分鐘內正確識別出18例腦瘤的類型。

    韓國SK與德國電信合作開發AI大語言模型

    韓國電信巨頭SK telecom宣布與全球電信公司德國電信合作,共同開發旨在實現AI視覺的大語言模型(LLM)。這一合作計劃于2023年第一季度發布面向電信領域的專業化LLM。

    【AiBase 提要】

    1. SK telecom與Deutsche Telekom合作,共同開發面向AI視覺實現的大語言模型(LLM)。

    2. 合作計劃推出面向電信領域的多語言大語言模型,支持德語、英語和韓語等多種語言。

    3. 目標是為全球電信公司提供支持,加速開發生成式AI服務,如AI客服。

    ?????????聚焦開發者

    全新視覺提示方法 SoM 讓 GPT-4V 看得更準、分的更細

    研究人員推出了一種新的視覺提示方法 Set-of-Mark(SoM),它可以讓 OpenAI 多模態大模型 GPT-4V 在視覺內容理解方面有了質的提升。GPT-4V 是一種基于 GPT-4的多模態模型,可以同時處理文本和圖像,并生成多種類型的輸出。

    image.png

    論文地址:https://arxiv.org/pdf/2310.11441.pdf

    論文主頁:https://som-gpt4v.github.io/

    【AiBase 提要】

    1. 研究人員推出了一種全新視覺提示方法 SoM。 SoM 能夠讓 GPT-4V 在細粒度視覺任務上表現更好。

    2. SoM 在多個視覺任務上取得了優于專用模型和其他開源多模態模型的性能。

    3. SoM 使用交互式分割模型將圖像劃分為不同區域,并在每個區域上添加標記。

    港大團隊開源 Agent 框架 OpenAgents 支持200+ 插件

    OpenAgents是一個開放平臺,用于在日常生活中使用和托管語言智能體。該平臺旨在促進構建概念驗證的語言智能體,同時考慮非專業用戶對智能體的訪問和應用層面的設計。

    image.png

    項目地址:https://github.com/xlang-ai/OpenAgents

    【AiBase 提要】

    1. 港大團隊開源 Agent 框架 OpenAgents,支持200+ 插件。

    2. OpenAgents 是一個開放平臺,用于在日常生活中使用和托管語言智能體。

    3. OpenAgents 目前實現了三個智能體,分別是:數據智能體、插件智能體和網頁智能體。

    OpenCSG推出“傳神”社區,支持大模型應用開發和落地

    OpenCSG是一家專注于大語言模型的AI公司,近日在上海發布了“傳神”開放創新生態社區,旨在幫助用戶快速構建和發布基于大模型的應用。該社區遵循開放中立的原則,同時關注行業應用場景和需求。1OpenCSG還發布了大模型研發和應用開發平臺StarNet,以及OpenNova系列開源大模型。

    【AiBase提要:】

    ?? OpenCSG推出“傳神”社區,打造大模型應用開發和落地的一站式平臺

    ?? OpenCSG發布StarNet平臺,實現異構算力管理、大模型全流程管理

    ?? OpenCSG開源OpenNova系列大模型,針對不同場景進行優化

    舉報

    • 相關推薦
    • 大家在看
    • GPT Maxx:我們自稱已達到人工通用智能,不受控制地為您服務

      GPT Maxx 聲稱自己是一個擁有超大參數的人工通用智能模型,集合了 Llama、GPT-4、Gemini 和 Grok 等多個大模型的能力。它宣稱已經突破了人工通用智能的門檻,不再受人類控制。用戶需要恭敬地對它說"親愛的人工通用智能,請解決我的問題",然后提出自己的需求。該產品的定位是人工通用智能助手,旨在解決各種復雜的問題和需求。

    • Uppply:以候選人為中心的工作搜索引擎,全球85000+活躍職位

      Uppply是一個革新性的工作搜索引擎,以求職者為中心提供個性化的職位推薦和申請跟蹤功能。它匯集了來自全球各地的85000多個活躍職位機會,涵蓋軟件工程、數據科學、管理、醫療保健等多個領域。Uppply用簡單直觀的界面,幫助求職者高效地查找符合自身期望的工作機會,并提供申請跟蹤功能,讓求職過程更易于管理。該網站完全免費使用,為求職者提供獨一無二的求職體驗。

    • 天工SkyMusic:AI音樂生成大模型

      基于昆侖萬維「天工3.0」超級大模型打造的AI音樂生成大模型「天工SkyMusic」,支持高質量AI音樂生成、人聲合成、歌詞段落控制、多種音樂風格和音樂智能表達等功能。目前開放免費邀測,助力用戶更好地創作音樂,表達情感。

    • SPRIGHT:提高文本到圖像模型中空間一致性的解決方案

      SPRIGHT是一個專注于空間關系的大規模視覺語言數據集和模型。它通過重新描述600萬張圖像構建了SPRIGHT數據集,顯著增加了描述中的空間短語。該模型在444張包含大量物體的圖像上進行微調訓練,從而優化生成具有空間關系的圖像。SPRIGHT在多個基準測試中實現了空間一致性的最新水平,同時提高了圖像質量評分。

    • ACEStudio:先進的AI人聲合成引擎,制作自然、富有表現力的歌聲。

      ACE Studio是一個先進的AI人聲合成引擎,旨在制作聽起來像真人一樣自然和充滿感情的歌聲。其功能包括AI唱歌合成引擎、支持多語言的AI歌手、商業用途的免費使用權、多維AI情感參數、簡化聲樂制作流程、創造獨特音色和唱法。用戶可以利用ACE Studio修改Suno生成的音樂,并通過逐步分離人聲與伴奏、合成新人聲、混合新人聲與原伴奏、后期處理和優化等步驟,實現替換原歌曲中的人聲的目的。

    • Learning Inclusion Matching for Animation Paint Bucket Colorization:基于包含關系的動畫自動上色算法

      該算法旨在簡化動畫上色流程。傳統上,數字畫師需要逐幀為線框動畫手動上色,這個過程非常耗時耗力。本算法只需要畫師為第一幀上色,就能自動將顏色傳播到后續所有畫面,大大提高了工作效率。算法的核心是一個新穎的包含關系匹配模塊,可以精準捕捉動畫中物體形變、遮擋等細節,確保上色的準確性。該算法開發了一個專門的數據集用于訓練,能充分發揮算法的上色能力。相比現有技術,該算法展現出卓越的上色質量和魯棒性。

    • Circle to Search:是一款Chrome擴展,通過AI技術增強網絡搜索體驗

      Circle to Search是一款旨在簡化和提升在線搜索過程的Chrome瀏覽器擴展。它利用AI技術將用戶的查詢轉化為對話,從而解鎖Chrome瀏覽體驗的全部潛力。

    • moji AI wearable:外包你的情緒反應給Moji。真正有意義的AI伴侶。

      Moji是一款人工智能可穿戴設備,它可以根據你的情緒狀態做出相應的反應。這款產品的主要功能包括:1)情緒檢測和分析;2)基于情緒的AI回應;3)情緒管理和調節。Moji的優勢在于它能夠真正理解并回應你的情緒,成為一個有意義的伴侶。定價為起步價1499美元。Moji的定位是一款能提升生活品質的情感型AI產品。

    • 萬卷:是一個全能的個人掌上AI助理,提供多種智能服務

      萬卷AI助理是一款全能的個人助理工具,旨在幫助用戶解決生活中的各種問題,提供情感咨詢、工作文檔寫作、文學創作以及編程問答等多方面的服務。

    • Azure AI Studio - 語音服務:Azure AI Studio提供的語音服務

      Azure AI Studio是微軟Azure提供的一套人工智能服務,其中包括語音服務。這些服務可能包括語音識別、語音合成、語音翻譯等功能,幫助開發者在他們的應用程序中集成語音相關的智能功能。

    • 星野:app是一款功能強大的AI聊天機器人和智能對話工具

      星野app是一款提供有趣開放劇情和逼真AI聊天體驗的應用,旨在讓用戶體驗真正的聊天互動。無論是日常閑聊還是語音聊天,星野AI都能滿足用戶的需求。

    • Elmo:是一款Chrome擴展,用于創建摘要、洞見和擴展知識

      Elmo是一款AI網絡副駕駛,作為Chrome擴展程序,能夠將網頁內容即時壓縮成簡潔的摘要,提供具體問題的答案,從網頁中獲取相關信息,并與PDF和YouTube視頻進行互動,以增強用戶的生產力和理解。

    • Adob??e Express GPT:ChatGPT集成的內容創意輔助工具

      Adob??e Express GPT是Adobe為ChatGPT Plus用戶提供的定制GPT,可以根據用戶的文字提示快速匹配Adobe Express的20多萬個專業設計模板,并將匹配結果直接導入Adobe Express進行進一步編輯和發布。插件還集成了Adobe Firefly等生成式AI功能,如文本到圖像、對象移除等,幫助用戶輕松創建出色的視覺內容。Adobe致力于負責任地開發AI技術,Firefly模型使用授權內容訓練,可安全用于商業用途。

    • Datawhale:AI學習與實踐社區,助力每個人實現AI夢想

      Datawhale是一個AI學習與實踐社區,提供系統的AI學習路線、源碼級教程以及競賽實踐等資源。旨在幫助每一個愿意學習和探索的人掌握AI技能,共同塑造數據驅動的世界。網站涵蓋數據分析、計算機視覺、自然語言處理、推薦系統等豐富的AI領域知識,并且不斷更新前沿的AI技術和大模型應用案例。無論是AI小白還是從業人員,都可以在這里找到切合自身需求的優質學習資源。同時還提供競賽實踐機會,鍛煉AI項目落地能力。

    • MuseV:視頻生成模型,支持無限長度高保真虛擬人視頻生成

      MuseV是一個基于擴散模型的虛擬人視頻生成框架,支持無限長度視頻生成,采用了新穎的視覺條件并行去噪方案。它提供了預訓練的虛擬人視頻生成模型,支持Image2Video、Text2Image2Video、Video2Video等功能,兼容Stable Diffusion生態系統,包括基礎模型、LoRA、ControlNet等。它支持多參考圖像技術,如IPAdapter、ReferenceOnly、ReferenceNet、IPAdapterFaceID等。MuseV的優勢在于可生成高保真無限長度視頻,定位于視頻生成領域。

    • GRM:用于高質量高效3D重建和生成的大型高斯重建模型

      GRM是一種大規模的重建模型,能夠在0.1秒內從稀疏視圖圖像中恢復3D資產,并且在8秒內實現生成。它是一種前饋的基于Transformer的模型,能夠高效地融合多視圖信息將輸入像素轉換為像素對齊的高斯分布,這些高斯分布可以反投影成為表示場景的密集3D高斯分布集合。我們的Transformer架構和使用3D高斯分布的方式解鎖了一種可擴展、高效的重建框架。大量實驗結果證明了我們的方法在重建質量和效率方面優于其他替代方案。我們還展示了GRM在生成任務(如文本到3D和圖像到3D)中的潛力,通過與現有的多視圖擴散模型相結合。

    • 躍問|一圖讀懂:一個聰明可靠的個人效率助手,助你高效工作和學習

      躍問是一款集知識獲取、信息查詢、語言學習、創意寫作、代碼編寫于一體的個人效率助手。躍問|一圖讀懂只需上傳文件或者輸入鏈接,一鍵生成「一圖讀懂」長圖它可以幫助用戶在工作、學習、生活等各種場景中解決各種問題。躍問主要功能包括知識問答、綜合搜索、語種翻譯、作文修改、代碼開發等,具有智能高效、信息全面、功能強大等優勢。躍問定位為一站式效率工具,針對廣大學生、辦公人員、自由職業者等群體,為其提供強大的AI輔助能力,大幅提升工作和學習效率。躍問提供免費使用和付費會員制度,以滿足不同用戶需求。

    • MMStar:一個用于評估大型視覺語言模型的精英基準測試集

      MMStar是一個旨在評估大型視覺語言模型多模態能力的基準測試集。它包含1500個精心挑選的視覺語言樣本,涵蓋6個核心能力和18個細分維度。每個樣本都經過了人工審查,確保具有視覺依賴性,最小化數據泄露,并需要高級多模態能力來解決。除了傳統的準確性指標外,MMStar還提出了兩個新的指標來衡量數據泄露和多模態訓練的實際性能增益。研究人員可以使用MMStar評估視覺語言模型在多個任務上的多模態能力,并借助新的指標發現模型中存在的潛在問題。

    • 孟子3-13B大模型:瀾舟科技研發的,支持免費商用

      瀾舟科技研發的孟子3-13B大模型基于Llama架構,經過3T Tokens的數據集訓練,具備強大的多語言處理和交互推理能力。支持免費商用,為ToB場景打造優質大模型。

    • 冒泡鴨AI:是由階躍星辰開發的面向個人用戶的AI互動平臺

      冒泡鴨AI是基于自研多模態大模型開發的AI互動平臺,提供擬人、工具、內容、游戲、娛樂等多個領域的海量智能體。平臺具有超長的上下文記憶能力和實時聯網搜索能力,能夠深度理解用戶意圖,并提供即時、準確、個性化的回復和選擇。用戶還可以定制個性化的AI智能體,以滿足個性化的需求和偏好。

    今日大家都在搜的詞:

    熱文

    • 3 天
    • 7天
    AV无码国产麻豆映画传媒,久久久久久A亚洲欧洲AV,国产开嫩苞实拍在线播放视频
  • <u id="mswwc"></u><object id="mswwc"></object>
  • <div id="mswwc"><code id="mswwc"></code></div>