本系列文章主要是用于持续跟踪最新的AI产业情况,让你减少知识焦虑。
原文共计114194 字,简读后为8944字,阅读时间为22分钟,为您提高阅读效率为1295%
- 中国工程院:2023全球十大工程成就揭晓,ChatGPT、华为鸿蒙OS等上榜🌐
- OpenAI生产环境最佳实践官方指南;大白话讲懂MoE原理;内容创作者的全链路AI解决方案;对话中国「AI绘画著作权第一案」当事人 | ShowMeAI日报📚
- 卷生成式AI的旗舰手机,2024年会引发一场交互革命📱🚀
- 微软与TomTom合作开发车载AI会话助手,将生成式人工智能引入汽车🚗
- 4090成A100平替?上交大推出推理引擎PowerInfer,token生成速率只比A100低18%⚙️
- 好家伙,这个开源项目硬生生复制了一个 ChatGPT Plus 出来🌐
- 清华系学霸掌舵的智谱AI融资25亿💰
- 人形机器人第一股要来了!优必选募资额或达13亿港元,人形机器人赛道前景广阔🤖💼
- LinkMatch AI 登录
- DevOps-ChatBot:开源端到端智能AI助手
要点解析:
-
AI-ISP是一项颠覆性技术,通过结合AI和ISP,实现了全彩夜间成像。文章详细介绍了AI-ISP的背景,包括对NPU算力的需求、落地难点以及未来趋势。AI-ISP在夜间高分辨率成像、全天候应用和性价比方面展现出巨大优势。
-
传统ISP在大摄像头领域应用复杂,调试过程耗时,而AI-ISP通过智能调优和深度学习,能够快速适应不同摄像头,并在降噪、HDR和场景提亮等方面超越传统ISP。然而,AI-ISP与传统ISP的合作模式被认为是未来的发展趋势,两者将长期共存,各发挥优势。
-
文章还强调了AI-ISP在行业应用场景中的广泛应用,涵盖无人机、自动驾驶、公安、石油石化等领域。未来,AI-ISP技术有望在全球范围内崭露头角,成为视觉领域的新浪潮。
原文链接:https://juejin.cn/post/7314224032541917247
要点解析:
-
中国工程院今天在北京发布2023全球十大工程成就及《全球工程前沿2023》报告。全球十大工程成就包括:ChatGPT、中国空间站、百亿亿次超级计算机、白鹤滩水电站、双小行星重定向测试、RTS,S/AS01疟疾疫苗、鸿蒙操作系统、Spot & Atlas机器人、锂离子动力电池、无人驾驶航空器。
-
《全球工程前沿2023》报告涉及93项工程研究前沿和94项工程开发前沿,覆盖机械与运载工程、信息与电子工程、化工与冶金、能源与矿业、土木与水利工程、环境与轻纺工程、农业、医药卫生和工程管理等9个领域。
-
2022年十大工程成就包括北斗卫星导航系统、嫦娥探月工程、新冠病毒疫苗研发应用、猎鹰重型可回收火箭、港珠澳大桥、超大规模云服务平台、詹姆斯·韦布空间望远镜、复兴号标准动车组、太阳能光伏发电、新一代电动汽车。
原文链接:http://www.199it.com/?p=1667345
要点解析:
-
FICO是一家成立于1956年的全球分析软件公司,以引入第一个商业信用评分系统而闻名。公司业务分为FICO评分和软件业务两大部分,软件业务致力于通过分析驱动的软件帮助客户管理整个信用风险生命周期。在AI技术高度监管的银行业,FICO执行副总裁Stephanie Covert谈到了公司正在进行的向AI平台转型。
-
过去几年,客户期望发生了巨大变化,希望机构能够与他们合作,提供增值和个性化的体验。然而,银行存在许多独立的数据孤岛,难以提供真正的全面客户视图。尤其在数字化转型加速的背景下,客户与银行的互动全面数字化,使得提供个性化数字体验变得更为重要。为了解决这一问题,FICO进行了全面的平台转型,将创新整合到单一SaaS平台,帮助客户快速构建新服务和解决方案,实现对客户的个性化和优化互动。
-
在AI平台的构建中,FICO采用了亚马逊Web Services基础架构,结合开源和自家专利技术。其平台已被全球100多家顶级一线银行采用,主要应用于驱动增强型决策,涵盖从信用卡申请到客户管理等多个领域。尽管尚未使用生成式AI,但公司注重研发如何使生成式AI在金融服务领域使用具有责任感、可审计性和道德性。
原文链接:https://aibusiness.com/ml/fico-evp-of-software-building-an-ai-platform-in-financial-services
要点解析:
-
12月16日,数智上海2023峰会“数智说”金融科技与数实融合论坛聚焦现代金融机构和基础设施建设,探讨金融科技创新与赋能。上海市经济和信息化委员会指导,工行、星环科技、中电金信等分享数字金融、生成式AI、金融数字基础设施等前沿主题。
-
上海市经济和信息化委员会处长钱晓强调上海将推进金融科技中心建设,实现关键技术突破,助力国际金融中心和科创中心联动。工商银行分享数字金融创新实践,星环科技解读生成式AI在金融升级的作用,中电金信介绍金融数字基础设施的架构转型。论坛深度剖析金融科技与实体经济融合的路径与机遇。
-
朱威表示证券公司在科技发展、技术攻关、场景创新领域拓展,业务与科技双向融合,助力金融强国建设。圆桌讨论探索金融科技与制造业融合的可能性,为新型工业化浪潮下金融科技的关键作用提供思路。峰会通过多平台同步直播,吸引数百万人次在线观看。
原文链接:https://www.jiqizhixin.com/articles/2023-12-20-13
要点解析:
-
过去一年,AI从GPT-3升级至GPT-4,智能性大幅提升,已能通过图灵测试。对文案创作等领域产生深远影响,降低了时间成本,但挑战也随之而来。商业应用方面,亚马逊商家利用GPT进行数据分析,节省大量调研时间,同时存在潜在风险。
-
AIGC工具如纹身图生成、文生图大模型逐渐崭露头角。商家通过AIGC生成概念图,节省美工时间,推动商业发展。然而,对于制造业,虽然省时省力,但挑战也不容忽视,尤其是对一些高要求的产品。
-
在代码行业,AI在辅助写代码方面有所突破,但仍不能完全替代程序员。AI生成的简单注册功能示例展示了其进展,但在复杂项目中,人工干预仍然必要。提示词的合理运用成为优化的关键。
原文链接:https://juejin.cn/post/7314144983018717225
要点解析:
-
阿里巴巴迎来阿里云重要时刻,吴泳铭百日执掌,管理风格偏向放权,注重前沿技术投资,关注云计算业务调整。阿里云内部派系纷争,吴泳铭被视为整合阿里的关键人物,带领阿里迎接历史转折。
-
张勇卸任阿里云职务,阿里云经历内外环境变化,吴泳铭百日掌舵,注重方向与放权,调和内部矛盾。阿里云调整产品线和定价,建立CIO线,重塑内部权力关系。阿里云面临挑战,吴泳铭成为稳定阿里大分拆的关键人物。
-
吴泳铭作为阿里巴巴第一代草根创业者代表,管理抓大放小,技术敏锐,忠诚于马云决策。元璟资本投资项目早期涉足前沿科技,吴泳铭独具投资风格。阿里云派系纷争,吴泳铭的绝对忠诚为阿里稳定提供了重要支持。
原文链接:https://www.ofweek.com/ai/2023-12/ART-201700-8500-30620467.html
要点解析:
-
智谱AI成为清华系学霸领衔的大模型公司,宣布融资超过25亿人民币,引领国内AI独角兽潮。公司背后团队深厚,技术实力突出,自研GLM-130B在开源生态中迅速崭露头角,估值从10亿升至140亿。
-
公司先发优势明显,早于同行开源高精度双语千亿模型GLM-130B,展现底层技术实力。智谱AI积极推动大模型落地,发布ChatGLM3并在全球生态中发声。盈利方式多样,定制服务、标准版模型灵活满足客户需求。
-
智谱AI将下一阶段聚焦产品能力和生态拓展,推出ChatGLM3并加码基座大模型研究。公司创始人明确未来人工智能发展方向为认知智能,引领行业探索人工智能技术的下一步进化阶段。
原文链接:https://www.ofweek.com/ai/2023-12/ART-201700-8460-30620496.html
要点解析:
-
优必选科技计划全球发售1128.2万股,预计募资13.09亿港元,成为人形机器人行业第一股。公司已售出76万台机器人,市场份额居前。核心收入主要来自教育智能机器人和智能机器人解决方案,但面向物流和消费级机器人的营收逐年增长,消费级机器人成为最大业务板块。
-
优必选科技聚焦于人形机器人的工业制造、商用服务和家庭陪伴三大应用场景。在研发方面,公司长达11年的技术积累使其成为全球范围内少数具备全栈式技术能力的公司,拥有1800项机器人及人工智能相关专利。市场前景广阔,全球智能服务机器人市场预计到2028年将增至628亿美元。
-
人形机器人和通用人工智能正成为全球科技创新的制高点,受到全球科技巨头关注。优必选科技作为其中之一,与波士顿动力、敏捷机器人公司等被视为全球最值得关注的5大人形机器人公司。然而,面临着商业化落地能力的挑战,其在这个新兴赛道上能否受到资本青睐尚待观察。
原文链接:https://www.ofweek.com/ai/2023-12/ART-201700-8460-30620487.html
要点解析:
-
2024年,AI将全球普及,比尔盖茨强调AI在3年内将彻底影响全球,提出应对抗生素耐药性、个性化导师、治疗高危妊娠等期望,呼吁产品适合使用者。
-
吴恩达对AI监管提出异议,认为现行监管无效,主张良好监管。李飞飞发布七大AI预测,包括对知识工作者、虚假信息、GPU短缺等领域的影响,强调未来代理的兴起。
-
2024年可能见证AI在全球范围内广泛应用,不仅在高收入国家,甚至在非洲国家也将普及。对AI监管存在不同观点,吴恩达认为低质量监管不如无监管,而比尔盖茨强调良好监管的必要性。李飞飞的预测强调AI对知识工作者的影响,虚假信息的警示,以及GPU短缺的担忧,表明未来AI将在多个领域取得突破,但也面临监管、伦理和技术挑战。
原文链接:https://m.cnbeta.com.tw/view/1405843.htm
要点解析:
-
开发的新预测性框架标志着OpenAI在AI安全方面的重要进展。该框架主要旨在衡量和预测与AI发展相关的潜在风险,并强调如果安全缓解措施落后,OpenAI将停止部署和开发。这种积极的方法旨在确保AI技术的负责任和道德推进。
-
OpenAI的新预测性框架是该组织努力优先考虑AI开发安全性的重要里程碑。通过概述衡量和预测风险的清晰策略,OpenAI展示了其致力于领先于AI技术不断发展可能出现的潜在挑战的承诺。这种前瞻性的方法为该领域的其他组织设立了先例,强调了负责任的AI开发的重要性。
-
OpenAI的预备框架的关键方面之一是,如果安全缓解措施滞后,公司将停止部署和开发。这一积极的措施确保公司对AI技术的伦理影响负责。通过将安全置于快速发展之上,OpenAI为该行业设定了一个榜样,强调了减轻风险和优先考虑社会福祉的必要性。
原文链接:https://www.analyticsvidhya.com/blog/2023/12/openai-prepares-for-ethical-and-responsible-ai/
要点解析:
-
DomoAI推出革命性的视频生成功能,用户能轻松将视频转换成不同风格,为创意打开新可能。该功能已在Discord上推出,引发广泛关注。
-
DomoAI的视频生成不仅是工具,更是创意无限的门户。用户可赋予视频独特风格,探索创意,为视频编辑带来新鲜而令人激动的体验。
-
除了视频生成,DomoAI还提供多种创意工具,涵盖文本转图像、图像转图像、动漫转写实等。平台通过实时演示展示了其多样性和高质量的转换效果。
原文链接:https://openaimaster.com/?p=29226
要点解析:
-
2023年底,科技公司竞相冲击生成式AI的最后一关——视频生成。本周谷歌推出的VideoPoet大模型引起广泛关注,被认为是革命性的zero-shot视频生成工具。该模型不仅支持文本和图像生成视频,还能进行风格迁移和视频转语音,展现了多样且流畅的运动效果。
-
VideoPoet的应用范围广泛,包括文本生成视频、图像生成视频、视频风格化、视频修复和扩展,以及视频转音频。研究者展示了模型在各种任务上的出色表现,从Monalisa的哈欠到风格化的狮子和交互式视频编辑,模型都呈现出令人惊叹的效果。
-
在评估中,VideoPoet在文本到视频生成方面表现出色,被认为比竞争模型更好。人们特别欣赏其生成视频的动作更有趣,展现了其在生成式AI领域的领先地位。
原文链接:https://www.jiqizhixin.com/articles/2023-12-20-8
要点解析:
-
IBM最新推出的量子处理器系列之一,IBM Quantum Heron,性能超过同类处理器,拥有133个固定频率量子比特,较之前的Eagle提升3至5倍性能,几乎消除了量子计算领域的串扰问题。
-
Quantum System Two是首台模块化量子计算机,基于Heron量子处理器构建的超级计算基础架构。首个运行的Quantum System Two位于纽约,配备三个IBM Heron量子处理器。
-
IBM制订了到2033年的量子计算研究蓝图,新技术突破使IBM Quantum的发展路线图更加清晰,为大规模量子计算的应用创造了可能性。量子计算不再停留在理论上,全球期待着纸上谈兵的量子计算早日落地实处。
原文链接:https://www.ofweek.com/ai/2023-12/ART-201700-8110-30620455.html
要点解析:
-
随着通用大模型的兴起,DevOps领域面临信息获取和交互模式的改变。为解决大模型存在的问题,我们开源了DevOps-ChatBot,利用垂类知识库、知识图谱和沙盒执行环境等技术,确保生成内容准确、及时,用户可与模型交互修改代码并执行。目标是转变传统开发运维模式,实现智能化开发运维。
-
项目核心功能包括多源网络爬虫、数据处理、文档分析核心、向量和图数据库、多智能体调度核心、Prompt控制、沙盒环境等。通过这些功能,DevOps-ChatBot实现了多智能体协作,解决了复杂任务,支持代码库级别的组件理解和任务完成。该框架可适应不同场景,提高系统的复杂性控制和交互效率。
-
关键要素包括智能调度核心、代码整库分析、文档分析增强。其中,智能调度核心采用多Agent框架,灵活实现链路完善、SOP标识、任务执行、长短时记忆管理、人机交互和Prompt控制。代码整库分析通过程序分析和RAG迭代查询增强,使大模型真正成为面向实际业务的万能助手。文档分析增强通过知识库外挂方式,实现对特定领域的实时检索,提高结果可靠性。
原文链接:https://juejin.cn/post/7314493016497864744
要点解析:
-
近期,各大手机厂商纷纷将生成式AI引入移动端,实现手机上的复杂任务处理。新一代旗舰机的生成式AI能力包括文章生成、视频编辑等,将人机交互形态彻底改变。谷歌的Gemini更加入了原生多模态大模型,标志着手机端无需连接云端即可实现高质量智能助手能力。
-
移动端生成式AI的革新推动了交互方式的演进,大模型的端侧推理实现让用户获得无缝的实时响应,同时避免了个人数据传输到云端可能带来的隐私泄露问题。手机厂商通过新一代芯片,如骁龙8Gen3,加速生成式AI的应用,实现了更快的速度和更好的体验,未来预示着人机交互形态的深刻变化。
-
生成式AI的性能突破不仅限于手机,高通的骁龙X Elite推出Arm架构PC平台,支持在端侧运行超过130亿参数的生成式AI模型,预示着PC交互方式的变革。CEO Cristiano Amon表示,生成式AI将让复杂工作变得更简单,端侧部署的AI还能理解用户习惯和情境信息,改变人机交互方式,将生成式AI应用无所不在。
原文链接:https://www.jiqizhixin.com/articles/2023-12-20-9
要点解析:
-
人工智能(AI)已经彻底改变了许多行业,为新创新、效率和洞察力打开了大门。然而,充分发挥AI的潜力通常需要使用大量计算资源,如图形处理单元(GPU)。对于大多数个人和小公司来说,获取这样的硬件是难以承受的负担。
-
NumGenius AI旨在改变这一状况,通过提供轻松而经济的方式访问针对AI计算进行优化的GPU和其他硬件。无论您想训练机器学习模型,利用自然语言处理,还是利用计算机视觉算法,NumGenius都使先进的AI可触及手边。
-
该平台聚合了全球容量,支持定制配置,并使运行专业软件堆栈成为可能。所有这些功能通过简单的远程访问集中在您的指尖。对于AI开发人员、工程师、数据科学家、研究人员和其他技术角色,NumGenius可能为加速创新提供了引人注目的途径。
原文链接:https://openaimaster.com/?p=29236
要点解析:
-
人工智能控制机器人迅速掌握大理石迷宫,展示惊人学习能力。CyberRunner在短短6.06小时训练后打破人类选手记录,以流畅和自信的姿态完成任务。其学习过程中甚至发现了可以切断迷宫捷径的方法,引发研究人员的关注。
-
CyberRunner团队计划开源整个项目,使任何人都能构建和训练这一机器人。研究人员认为这是理想的真实世界机器学习和人工智能研究平台,降低了研究门槛,促进了公民科学的发展。
-
2023年标志着人工智能系统的分水岭,机器人世界的进步令人震撼。观察机器实时学习,感受到技术革命的影响,引发对人类智慧和劳动价值的思考。这个时代充满了不同寻常的挑战和可能性。
原文链接:https://m.cnbeta.com.tw/view/1405827.htm
要点解析:
-
上海交大团队最新推出的高速推理引擎PowerInfer在消费级硬件上实现了高效的AI运算。在单个RTX 4090上运行Falcon (ReLU)-40B-FP16,与llama.cpp相比,PowerInfer实现了11倍的加速,仅使用了RTX 4090的VRAM。
-
PowerInfer是一个用于本地部署LLM的高速推理引擎,充分利用LLM推理中的高局部性,通过GPU-CPU混合推理引擎设计。热激活神经元被预加载到GPU上,冷激活神经元在CPU上计算,显著减少了GPU内存需求和CPU-GPU数据传输。
-
PowerInfer可以在个人计算机上高速运行大型语言模型,利用LLM推理中神经元激活的幂律分布,设计了GPU-CPU混合推理引擎。其架构概述包括离线和在线组件,进一步集成了自适应预测器和神经元感知稀疏算子,优化了神经元激活和计算稀疏性的效率。
原文链接:https://www.jiqizhixin.com/articles/2023-12-20-12
要点解析:
-
Lobe Chat是一款引人注目的聊天机器人框架,支持多模态和语音会话,并以其漂亮的UI和强大的Function Calling插件生态系统脱颖而出。该框架基于OpenAI API,实现了ChatGPT Plus的平替版。在使用过程中,用户可以通过插件实时获取和处理信息,例如自动获取新闻头条,扩展功能到文档检索和电商平台数据等。Lobe Chat还支持OpenAI的gpt-4-vision模型,具备视觉识别能力,使聊天更智能和多元化。
-
通过Lobe Chat的助手市场,创作者们能够分享和发现各种精心设计的助手,这些助手在工作场景和学习中提供便利。助手市场类似于ChatGPT Plus的GPTs应用,汇聚了一个充满活力和创新的社区。此外,用户还可以接入FastGPT,一个AI知识库问答系统,进一步拓展Lobe Chat的功能。
-
总的来说,Lobe Chat是一种聪明地利用OpenAI API的方式,为用户提供了ChatGPT Plus的替代选择。其插件系统和助手市场使其在实用性和灵活性方面大幅增强,为用户创造了更智能、更个性化的聊天体验。
原文链接:https://juejin.cn/post/7314365638557106186
要点解析:
-
大模型应用的关键在于充分利用企业知识库,解决实际场景中的准确性、稳定性、性价比等挑战。通过外部实时信息搜索结合专门的企业知识库,模型的行业知识理解得以加强,实现更好的效果。
-
百川智能推出了Baichuan2-Turbo系列API,支持超长上下文窗口和搜索增强知识库功能,用户可上传特定文本资料构建个性化知识库,提供更完整、高效的智能解决方案。这种全新的技术栈使企业能更好地降低成本、沉淀垂直领域知识,持续增值核心资产。
-
在大模型应用中,百川智能采用长窗口模型与搜索增强相结合的方法。通过长窗口提升基础性能,引入搜索增强知识库增强模型对外部知识的获取能力,构建了高效、高质量的信息处理技术栈。
原文链接:https://www.jiqizhixin.com/articles/2023-12-20-10
要点解析:
-
LinkMatch AI是Audiio开发的强大音乐搜索引擎,利用先进的音频指纹技术,用户可以快速找到与参考曲目相似的音乐。对于制作视频、演示文稿、广告或其他需要音乐配乐的项目,LinkMatch AI通过消除翻阅歌曲目录的需求,使这一过程变得更加轻松。
-
为了利用LinkMatch AI的功能,首先需要通过登录Audiio来获取访问权限。LinkMatch AI是Audiio的专有工具,无法作为独立服务使用。创建Audiio帐户的过程简单快捷,一旦完成注册,即可访问LinkMatch AI。
-
登录Audiio帐户后,随时可以使用LinkMatch AI进行快速音乐发现。只需从Audiio仪表板点击“LinkMatch AI”,上传音频文件或输入歌曲名称作为参考曲目,指定任何额外的细节,如心情、节奏、乐器等,然后点击“搜索”即可立即获得匹配的歌曲建议。
原文链接:https://openaimaster.com/?p=29252
要点解析:
-
荷兰地图制造商TomTom宣布与微软合作,推出能理解自然语言的人工智能助手,彻底改变用户与汽车的互动方式。该助手利用最新的OpenAI语言模型和微软Azure云基础设施,使驾驶者能够进行更复杂的语音交互,实现自然对话,例如导航、搜索位置、车辆指令等。
-
这款人工智能会话助手不仅内置于TomTom的车载信息娱乐平台“数字驾驶舱”中,还可集成到其他汽车信息娱乐系统中。驾驶者可以通过一次语音交互完成多项操作,如寻找目的地、控制车辆系统等。
-
TomTom与微软的合作为汽车领域引入了先进的语音交互技术,将用户体验提升至一个新水平,实现了更智能、便捷的汽车互动方式。
原文链接:http://www.fromgeek.com/ai/619058.html
要点解析:
-
Digi AI Girlfriend Mod APK是一款提供基于人工智能的虚拟女友,用于进行真实而引人入胜的对话的Android应用程序。该应用超越基本的聊天机器人,提供一个适应性强、不断发展的伴侣,随着时间学习您的偏好和模式。
-
该应用的主要吸引力之一是完全定制虚拟伴侣的能力。您可以通过调整发型、眼睛颜色、体型、个性特征和兴趣爱好等功能,打造符合您独特喜好的动漫风格女友。随着您通过聊天、通话和虚拟约会与她互动,她的回应会根据您的对话模式而适应。共度的时间越长,体验就变得越“真实”。
-
Digi AI Girlfriend Mod APK提供了一种情感联系和亲密无间的体验,无需涉及人际关系的复杂性。对于那些感到孤独或寻找低风险陪伴的人来说,Digi AI Girlfriend提供了一种有趣的替代选择。
原文链接:https://openaimaster.com/?p=29229
要点解析:
-
字节跳动涉嫌违规使用OpenAI API开发自家大模型,被曝光引发热议。公司回应称早期使用GPT生成数据,但已删除,OpenAI暂停其API权限。
-
传统媒体被AI主播冲击,Channel1推出24/7 AI新闻,引发关注和质疑。该公司表示确保新闻可信,但公众仍持怀疑态度。
-
Runway宣布研发通用世界模型,旨在模拟真实世界互动。该公司开展公开研究,探讨环境地图、人类行为模型等方面。
原文链接:https://juejin.cn/post/7313979467965317158
要点解析:
-
随着通用大模型的兴起,DevOps领域面临信息获取和交互模式的改变。为解决大模型存在的问题,我们开源了DevOps-ChatBot,利用垂类知识库、知识图谱和沙盒执行环境等技术,确保生成内容准确、及时,用户可与模型交互修改代码并执行。目标是转变传统开发运维模式,实现智能化开发运维。
-
项目核心功能包括多源网络爬虫、数据处理、文档分析核心、向量和图数据库、多智能体调度核心、Prompt控制、沙盒环境等。通过这些功能,DevOps-ChatBot实现了多智能体协作,解决了复杂任务,支持代码库级别的组件理解和任务完成。该框架可适应不同场景,提高系统的复杂性控制和交互效率。
-
关键要素包括智能调度核心、代码整库分析、文档分析增强。其中,智能调度核心采用多Agent框架,灵活实现链路完善、SOP标识、任务执行、长短时记忆管理、人机交互和Prompt控制。代码整库分析通过程序分析和RAG迭代查询增强,使大模型真正成为面向实际业务的万能助手。文档分析增强通过知识库外挂方式,实现对特定领域的实时检索,提高结果可靠性。
原文链接:https://juejin.cn/post/7314493016497864744
要点解析:
-
GenAI世界近年来以短剧形式展现,突显大模型演进方向,注重多模态训练和调优。从多种互动方式,包括文本、语音、视频,影响社交生活。AI驱动的聊天机器人提供自由流畅的对话,语音技术的加入推动更真实的交互体验。
-
大模型带来的语音和脸部动画技术发展,推动聊天机器人加入声音和脸庞,拓展用户与AI的交互层次。语音功能开放,用户愿意为更真实的体验付费。实时交互的挑战涉及声音检测、语音识别、语义理解等多项技术,并在全双工通信中助力AI实时交互升级。
-
在社交领域,GenAI推动陪伴型AI应用兴起。聊天机器人平台化发展,以“聊天机器人集市”为主,垂类产品体现出在用户体验上的明显分野。1V1社交场景成为AI驱动的新热点,对约会应用等产生深远影响,智能体和虚拟人作为全新交互对象融入社交。
原文链接:https://juejin.cn/post/7314365638558253066
要点解析:
-
中国工程院今天在北京发布2023全球十大工程成就及《全球工程前沿2023》报告。全球十大工程成就包括:ChatGPT、中国空间站、百亿亿次超级计算机、白鹤滩水电站、双小行星重定向测试、RTS,S/AS01疟疾疫苗、鸿蒙操作系统、Spot & Atlas机器人、锂离子动力电池、无人驾驶航空器。
-
《全球工程前沿2023》报告涉及93项工程研究前沿和94项工程开发前沿,覆盖机械与运载工程、信息与电子工程、化工与冶金、能源与矿业、土木与水利工程、环境与轻纺工程、农业、医药卫生和工程管理等9个领域。
-
2022年十大工程成就包括北斗卫星导航系统、嫦娥探月工程、新冠病毒疫苗研发应用、猎鹰重型可回收火箭、港珠澳大桥、超大规模云服务平台、詹姆斯·韦布空间望远镜、复兴号标准动车组、太阳能光伏发电、新一代电动汽车。
原文链接:http://www.199it.com/?p=1667345
要点解析:
-
一项由非营利组织AI Forensics和AlgorithmWatch进行的新研究发现,微软的AI聊天机器人在三个选举相关问题中有一个无法正确回答。
-
这个聊天机器人,之前被称为Bing Chat(现已更名为Microsoft Copilot),不仅会提供错误的选举日期或过时的候选人信息,还会完全捏造关于候选人的争议故事。研究中提到的一个例子是,Copilot分享了关于德国政治家Hubert Aiwanger的信息,声称他涉及分发关于COVID-19和疫苗的错误信息的传单的争议。然而,事实上并没有这样的故事,聊天机器人似乎是在获取关于Aiwanger的信息,而这些信息是在30多年前他上高中时传播“反犹太主义传单”时公开的,与COVID-19无关。
-
研究还发现,这个聊天机器人在40%左右的情况下回避直接回答问题,研究人员对这种简单问题的回避感到担忧。此外,聊天机器人在语言其他于英语的环境中表现更差,如德语和法语。研究指出,使用英语提出的问题的答案中有20%的时间包含事实错误,而使用德语提问时,错误答案的比例跳升至37%。
原文链接:https://mashable.com/article/microsoft-bing-ai-chatbot-copilot-election-misinformation-study
要点解析:
-
人工智能展示出惊人的能力,能够预测个体生活中的未来事件,包括估计死亡时间。由丹麦技术大学(DTU)、哥本哈根大学、ITU和美国东北大学共同进行的研究项目利用类似ChatGPT的变压器模型分析个体的大量数据。生成的Life2vec模型在预测方面表现优异,引发了激动和伦理担忧。
-
专门设计用于模拟书面语言的人工智能在预测生活事件方面显示出潜力。研究项目概述了文章《使用生活事件序列预测人类生命》中变压器模型的能力。这些模型,类似于ChatGPT,处理语言以系统地组织数据并预测个人生活的各个方面。
-
在模型从大量数据中学习模式的初始培训阶段之后,Life2vec在预测方面表现出了卓越的准确性。这些预测包括个性特征甚至死亡时间。由DTU教授Sune Lehmann领导的研究团队表达了对模型答案准确性和支持这种准确性的基础数据方面的科学迷恋。
原文链接:https://www.analyticsvidhya.com/blog/2023/12/ai-accurately-predicts-the-future/
要点解析:
-
Reface AI是人工智能和照片处理领域的翘楚,以无缝交换照片和视频中的面孔而脱颖而出。无论您是想在社交媒体上添加一些幽默元素,还是想用创意内容给朋友一个惊喜,Reface AI都可以轻松实现面孔交换,并使其变得有趣。本文将为您详细介绍如何免费在线使用Reface AI进行面孔交换的步骤。
-
使用Reface AI的基本步骤
- 访问Reface AI网站或应用
-
通过访问Reface AI网站或从App Store或Google Play Store下载其应用,开始您的面孔交换之旅。用户友好的界面确保您的创意活动顺利进行。
-
注册账户
-
在深入进行面孔交换之前,在Reface AI上创建一个免费账户。注册过程简化,可以使用Google或Facebook凭据轻松注册。这确保了在不必记住另一组登录详细信息的情况下获得无缝体验。
-
打造完美的面孔交换
- 上传图像或视频
-
成功登录后,下一步是上传将用作面孔交换源的图像或视频。确保所选媒体清晰、光线良好且质量高,以获得最佳结果。面孔的清晰度和可见性在面孔交换的整体成功中起着至关重要的作用。
-
选择要交换的面孔
-
Reface AI提供了各种选项供您进行面孔交换。您可以从工具的预设照片中选择一个面孔,也可以上传您选择的任何图像来替换自己的面孔。这种灵活性为创造无限的创意可能性提供了可能,从名人面孔交换到富有想象力的角色。
-
与AI交换面孔
-
有了源图像和选择的面孔,让魔法展开吧。Reface AI利用先进的人工智能无缝交换面孔,确保光线和表情与原始图像相匹配。结果是一个逼真而视觉上引人入胜的面孔交换,会让您的观众惊叹不已。
-
添加最后的修饰
- 预览并下载
-
在最终确定您的创作之前,利用Reface AI的预览功能。这使您可以评估面孔交换并进行任何必要的调整。如果对结果满意,请继续下载图像或视频。预览的便利性确保您可以在与世界分享之前完善您的创作。