Skip to content

Latest commit

 

History

History
610 lines (305 loc) · 49.1 KB

20240103.md

File metadata and controls

610 lines (305 loc) · 49.1 KB

目的

本系列文章主要是用于持续跟踪最新的AI产业情况,让你减少知识焦虑。

看点

原文共计211278 字,简读后为12144字,阅读时间为30分钟,为您提高阅读效率为1760%

  • 免费在线进行AI吸引力测试 🌟
  • 三星Galaxy S24系列由Eureka AI提供动力,将于2024年1月发布 🚀
  • 三星发布Galaxy S24神秘预告:迎接Galaxy AI时代 🌌
  • 2024年AI将为您做什么?必须关注的十大趋势 📈
  • 科技部发文规范AI使用,禁止AIGC直接生成申报材料 🚫
  • 商汤元萝卜光翼灯发布:国家AA级标准,AI光随书动,1699元 💡
  • deepin深度操作系统推出“看图AI插件”,支持设备端“图像上色”“转换风格”等8大功能 🎨
  • 《自然》关注:AI读片或是阿尔茨海默病诊断新希望!人工智能算法准确率已超过90% 👁️‍🗨️
  • AAAI 2024 Fellow公布,清华大学朱军教授入选 🏆
  • AI时代数据应用的全链路工厂 - Chat2DB 🤖🔗

AI 立大功!神经网络对太阳图像进行三维重建,首次揭示太阳极点

要点解析:

  • 科罗拉多州国家大气研究中心(NCAR)的研究人员利用NeRFs神经网络,将太阳的二维图像转换成三维重建图像,揭示了太阳的两极。极紫外辐射(EUV)是指波长在10~120 nm范围的太阳辐射,对近地轨道卫星大气阻力和人类健康有影响。通过SuNeRFs模型,他们实现了高准确度的太阳三维重建,为观测非黄道部分提供了解决方案。

  • 为解决EUV预测难题,研究团队选取了256张从均匀间隔的观测点拍摄的太阳前向模型图像,使用SuNeRFs神经网络进行算法训练。通过调整NeRFs模型以适应太阳的物理实际,他们成功地将二维图像转换为具有高质量的三维几何形状的重建图像,为太阳物理学研究提供了新的视角。

  • 太阳,作为地球最密切的恒星,一直是科研人员追寻的对象。通过夸父一号等探日卫星,中国在太阳物理研究领域取得了重要进展。夸父一号实现了三个首次,为我国在太阳物理研究领域的影响力提供了强有力的支持。

https://juejin.cn/post/7319669728813531148

科技部发文规范AI使用,禁止AIGC直接生成申报材料

要点解析:

  • 科技部监督司发布《负责任研究行为规范指引(2023)》,明确科研人员及单位在研究选题、数据管理、成果署名、同行评议、伦理审查等方面应遵循的科学道德准则。

  • 指引明令禁止使用生成式人工智能直接生成申报材料,并要求科研人员贯穿科技伦理要求于整个研究活动。突破性研究成果的发布需经科研单位同意,未经验证的成果不得传播,已发表论文不得拼凑再发表。

  • 指引要求科技伦理审查覆盖涉及人、动物、生命健康、生态环境等伦理风险的科技活动,并强调在紧急状态下的科技活动需遵守应急审查程序,不得回避或降低科技伦理审查标准。

https://www.ithome.com/0/743/159.htm

美国最高法院警告法律行业AI的危险

要点解析:

  • 美国最高法院在2023年底的报告中探讨了人工智能在法律系统中的运用,承认其潜力,同时警告不要「使法律失去人性」。

  • 最高法院首席大法官约翰·罗伯茨强调AI对无法负担律师费的人的帮助,但也指出潜在风险,尤其是在不当应用时。他警告决策中需要人类评估、裁量和对细微差别的理解,仅仅委托给算法可能导致不令人满意和不公正的结果。

  • 报告中指出,AI已经在美国法律系统产生影响,但法律专业人士对AI的理解滞后,一些案例中机器学习技术已经对法律系统产生负面影响,如使用ChatGPT撰写虚构案例的律师被罚款。报告提醒法庭在技术演进中需谨慎考虑AI在诉讼中的适当使用。

https://mashable.com/article/ai-artificial-intelligence-supreme-court-law

人类千亿科学豪赌与中美景观;LLM学习路线图;AI搜索引擎解析;美图AI动漫技术方案;O'Reilly LLM新书预览 | ShowMeAI日报

要点解析:

  • Adobe与Figma原计划2022年9月宣布200亿美元收购,但在2023年底宣布取消收购,支付10亿美元违约金。Figma在UX设计领域占据主导地位,但由于AIGC的影响,整个行业对UX设计需求减弱,导致收购计划破裂。

  • Perplexity AI是一款对话式AI搜索引擎,由OpenAI前员工创建。文章解读了Perplexity的成功因素,商业模式和技术发展,并提到中国市场对类似产品的需求。Perplexity的发展历程为其他AI产品开发者提供了学习的蓝本。

  • 美图AI探索视频生成领域,分享了在视频内容理解、时域一致性和长视频生成方面的技术挑战和解决方案。文章突显了该领域稳定性和部署方面的挑战,以及工程师在技术上的卓越贡献。

https://juejin.cn/post/7319464401068818432

数智上海2023峰会:通用、垂直、AI Agent,大模型应用场景详解

要点解析:

  • 通用大模型在行业场景中难以精准满足用户需求,转向学习行业知识和语料,演变为垂直大模型,成为场景大模型的关键路径。

  • 数智上海 2023 峰会探讨了大模型的演进,分享了在医疗、教育、工业等领域落地的关键经验,强调大模型为各行业带来的创新机遇。

  • 各领域嘉宾分享了大模型应用,如商汤在医疗领域推出的多模态基础模型群,以及科大讯飞在教育中的多场景应用。

https://www.jiqizhixin.com/articles/2024-01-03-8

苹果:别争了,AI时代的新iPhone仍是iPhone!

要点解析:

  • 苹果通过构建与闪存行为相协调的推理成本模型,解决了在内存有限设备上部署大模型的难题。这一技术使大模型在小型设备上的运行速度提高了25倍,为iOS设备上的生成式AI提供了可能性。

  • 苹果加快自主人工智能技术的开发步伐,建立了大型语言模型Ajax,推出内部聊天机器人代号为"Apple GPT",并在多个应用中大力应用语音、图像等识别技术。最近发布的M3 Max芯片也明确定位为开发AI产品的工具。

  • 苹果的AI投入不断增加,高层团队致力于生成式人工智能项目,招募机器学习专家,同时加速研发底层技术,包括监督Siri的改造和领导开发新的人工智能iOS应用体验。

http://www.geekpark.net/news/329919

AI时代数据应用的全链路工厂 - Chat2DB

要点解析:

  • 随着年末的临近,技术公司纷纷展开年终总结。绩效总结的关键在于实际数据,但业务同学常常面临获取数据的难题,导致频繁向开发人员请求,加重了开发同学的负担。为解决这一问题,本期开放麦邀请到 Chat2DB 作者姬朋飞,他分享了业务同学和开发同学在数据处理方面的困境以及如何利用 Chat2DB 解决这些问题。

  • 在年终总结时,业务同学需要准备大量业务汇报和结果分析,却不擅长获取业务数据。开发同学则面临项目 deadline 和被频繁要求提供数据的窘境。为应对这一矛盾,姬朋飞介绍了 Chat2DB 作为解决方案的秘密武器,让业务同学不再追着开发人员要数据,同时减轻了开发同学的工作负担,实现了更高效的数据协同。

https://juejin.cn/post/7319410253661061154

这是您所需的AI简报 #80

要点解析:

  • 本周AI领域集中关注人工智能模型的法律后果。纽约时报起诉微软和OpenAI侵犯版权,指控其未经许可使用数百万篇报纸文章训练聊天机器人。这引发了有关AI技术与知识产权之间关系的法律辩论,尤其是基于大型语言模型、扩散模型和最近的图神经网络的重大突破。由于这些模型的训练通常使用大量互联网抓取的数据,其中包含受版权保护的内容,当前法律体系对生成式AI内容并不完全适用,这带来了激烈的争论和不同的法规和法律决定预期。

  • 现有法律体系并不为生成式AI内容而设计,对于如何调整以应对它存在强烈分歧。LLM的训练和推理并非传统意义上的复制和重用内容,但也不等同于人类阅读并从其他人的内容中获取“灵感”。互联网上的内容通常可供大型科技公司的网络爬虫进行索引和搜索,但用于模型训练的目的显然不是等同的用例。不同的人可以以不同方式解释这些差异,导致激烈辩论,我们预计各个司法管辖区将出台不同的法规和法律决定。例如,今年早些时候,日本确认不会对用于AI培训的数据执行版权。

  • 解决这些AI版权问题的结果将对未来LLM的质量、成本和进展速度以及现有版权所有者和人类内容创作者的生计产生重大影响。在生成式AI内容的世界中,我们认为重要的是,在花费时间、金钱和专业知识制作的内容仍然能够在一片AI生成的内容中得到回报。但也有许多新的版权法和法律解释可能过于繁琐,不必要地阻碍AI能力的发展。2024年,我们将开始看到这一切如何发展。

https://towardsai.net/p/artificial-intelligence/this-ai-newsletter-is-all-you-need-80

三星2027年愿景:人工智能集成摄像头

要点解析:

  • 三星推动摄像技术革命,计划到2027年将人工智能直接整合到其图像传感器中。项目名为“人形传感器”,旨在复制人类视觉。与SK Hynix推出集成AI处理芯片的相机传感器相呼应,显示行业朝着在传感器上进行AI处理的方向转变。

  • “人形传感器”计划将AI无缝整合到相机图像传感器中,超越传统方法依赖设备的CPU进行图像处理。与传统传感器不同,AI集成传感器在传感器级别直接处理数据,承诺提高图像质量,减少延迟,并降低功耗。目标是创建能够模仿人类感觉的传感器,可能在2027年达到500到600兆像素。

  • 作为即将推出的计划的一部分,三星传闻将向其Galaxy智能手机系列引入类似于Google Pixel 8系列的AI功能。这些功能包括使用关键字组合生成壁纸,使用AI重新排列图像中的对象,并使用户能够将图像扩展到其原始边界之外。此外,Samsung Notes应用将受益于AI集成,提供大段落的自动格式化,并在用户提示时生成摘要。

https://www.analyticsvidhya.com/blog/2024/01/samsungs-vision-for-2027-ai-integrated-cameras-with-human-vision/

科技股开年抛售潮背后 AI美梦开始醒了?

要点解析:

  • 2024年伊始,美国科技股迎来暴跌,纳指100单日跌幅1.7%,苹果、英伟达、AMD等高位股惨跌,市值蒸发超过2380亿美元。资本市场对AI炒作失去耐心,预计24财年生成式AI收入增幅仅为低个位数。

  • 华尔街分析师指出,AI并非企业增加云支出的主要动力,首席信息官普遍仍在AI探索阶段。即便微软等大企业投身AI,业绩助力难以确定,AI在B端商业应用尚处早期,预计商业化晚于基础设施层2-3个季度。

  • 随着科技公司发布四季报,若AI应用未能带来超预期业绩,股价或面临风险。分析师警告人工智能炒作高峰期可能迎来幻想破灭,生成式AI收入实现时间较长,24财年收入预期仅有低个位数上升空间。

https://awtmt.com/articles/3705523

三星Galaxy S24系列由Eureka AI提供动力,将于2024年1月发布

要点解析:

  • 三星电子将于1月17日在圣何塞的Unpacked活动上发布备受期待的Galaxy S24系列。该科技巨头承诺引领移动人工智能的新时代,为革命性的移动体验奠定基础。他们的新一代旗舰设备将改变我们生活、连接和创造的方式。以下是关于三星最新Galaxy Eureka人工智能手机发布的一切你需要知道的。

  • 三星电子即将在Unpacked活动上震撼全球,推出Galaxy S24系列。定于1月17日举行的此次活动承诺带来一次开创性的体验,将重新定义我们与智能手机的互动。三星官方渠道的直播确保全球爱好者可以见证这一发布,创造一个全球性的奇观。

  • 据报道,Galaxy S24系列不仅是一款智能手机;它是人工智能能力的强大动力。通过Galaxy S24、Galaxy S24 Plus和Galaxy S24 Ultra,三星旨在提供有史以来最智能的人工智能手机。泄漏信息表明有重大升级,包括Ultra型号的钛金属框架、Snapdragon 8 Gen 3芯片组以及其他型号的强大Exynos 2400芯片组。

  • Galaxy S24系列的亮点在于其人工智能功能。Live Translate、Generative Edit、Nightography Zoom和High Resolution只是人工智能功能的冰山一角。Live Translate实现了跨语言的无缝沟通,而Generative Edit提供了图像编辑的独特方法。Nightography Zoom和High-Resolution承诺无与伦比的摄影体验,使这个新的旗舰系列成为摄影爱好者的梦想。

  • 三星通过Galaxy S24系列彰显了对人工智能的承诺。该公司的新生成式人工智能模型Gauss类似于ChatGPT的强大能力,承诺增强功能和能力。凭借高通的Snapdragon 8 Gen 3处理器和三星的Exynos 2400,Galaxy S24系列站在人工智能创新的前沿,有望重新塑造智能手机领域。

  • 三星进入Galaxy S24系列人工智能领域的早期发布表明这是一项战略举措,旨在占领市场,特别是注重生成式人工智能升级。行业向人工智能驱动的增强功能转变符合消费者需求,而三星旨在通过其最新旗舰满足这些期望。这些智能手机证明了技术和人工智能不断演进的交汇点。在我们急切期待Unpacked活动的同时,新时代移动人工智能的承诺似乎比以往更近。

https://www.analyticsvidhya.com/blog/2024/01/samsung-galaxy-s24-series-powered-by-eureka-ai-to-launch-in-january-2024/

2024年AI将为您做什么?必须关注的十大趋势

要点解析:

  • 2024年AIGC应用十大趋势揭示了AI在工具化、超级入口、新工种等方面的迅速发展。其中,AI Agent和超级入口成为关键词,预示着个性化AI助手将成为工作与生活的新常态。钉钉等超级App已成为AI应用的重要入口,推动人机协同模式的普及。

  • AIGC技术发展呈现生成式AI的变革,从生成文字到代码、图片、视频的逐步成熟。建议在新年中,充分利用AI提升工作效率,尤其在文字、代码领域。超级App如钉钉通过AI PaaS智能化底座提供了更多AI能力,成为AI应用和工具的超级入口。

  • 新一年AI技能的提升至关重要。在超级App钉钉上学习和使用AI趋势,将AI应用于文字、代码、作图、视频等领域,提高工作效率。趋势明确,掌握AI技能助力未来竞争力,新机会将垂青于备好了的人。

http://www.qbitai.com/?p=111388

与AI相关的初级职位提供128%更高的薪水

要点解析:

  • 报告显示,与其他职业相比,与AI相关的工作薪资较高,平均高出78%。这一差距在初级职位尤为显著,初级AI职位的薪资比其他职业高出128%,中级为58%,高级为47%。

  • 技术和非技术职位之间的薪资差距由于AI而扩大了36%,预计到2024年,计算机科学行业将有可能新增13.1万个与AI相关的工作岗位。企业高管们认识到AI在工作场所的潜力,70%的受访者表示他们正在大力投资生成式AI,以保持未来的竞争优势。

  • KPMG国际的全球首席数字官Lisa Heneghan指出,生成式AI已经成为董事会热议的话题,领导者们正努力更好地理解其潜力,并在业务战略中如何实施这项技术。挑战在于在正确的地方花钱,并拥有充分利用其机会的正确技能。

https://hackernoon.com/ai-related-entry-level-roles-offer-128percent-higher-salaries?source=rss

浪潮信息市值蒸发50%,工业富联市值缩水2400亿,算力市场是否遭遇过热?

要点解析:

  • 工业富联在新年第一个交易日下跌6%,市值降至2757亿元。ChatGPT推动人工智能概念活跃,但工业富联自AI算力龙头创新高后,市值缩水47.9%。

  • 全球算力需求激增,英伟达成为大模型最大赢家,市值达1.19万亿美元。生成式AI推动全球智能算力需求增长,IDC预测生成式AI计算市场占整体市场比例将从4.2%增至31.7%。

  • 工业富联与浪潮信息市值受ChatGPT热潮影响,市场前景看好。然而,浪潮信息在营收与净利润方面遭遇下滑,市值回调51.8%。ChatGPT的发展将正向促进AI算力相关的资本支出增长。

https://www.ofweek.com/ai/2024-01/ART-201700-8110-30622076.html

面向超长上下文,大语言模型如何优化架构,这篇综述一网打尽了

要点解析:

  • 长文探讨基于 Transformer 的大型语言模型(LLM)在优化长上下文能力方面的最新进展。ChatGPT的诞生为通用人工智能(AGI)应用提供了革命性的可能性,但当前主要受限于在短文本上的预训练,导致在长上下文处理方面表现较差。

  • 论文细致分析了处理长上下文输入和输出的问题,并提出了一套分类体系指导基于 Transformer 的模型升级。从高效注意力、长期记忆、外推性位置编码、上下文处理到各类改进方法,全面梳理了提升LLM在长上下文场景中表现的各种策略和方法。

  • 未来方向包括解决注意力复杂度、记忆效果和效率、长度外推挖掘等问题。提出对特定但通用目标的需求,以及更可靠的度量方法的迫切性。综合评述了当前进展和未来挑战,为基于 Transformer 的LLM在长上下文能力方面的发展指明了方向。

https://www.jiqizhixin.com/articles/2024-01-03-3

使用OpenAI、Langchain和Qdrant DB通过Streamlit应用查询新闻文章

要点解析:

  • 聊天机器人融入新闻查询,在用户访问新闻时发挥着重要作用。它们为用户提供了一种方便而富有对话性的方式,消除了浏览网站或应用的需要。用户只需向聊天机器人询问特定主题或事件的新闻,使信息更易获取,尤其适用于那些发现传统方法具有挑战性的用户。

  • 个性化是新闻行业聊天机器人的关键特点。通过从用户过去的查询和交互中学习,聊天机器人可以呈现更相关和个性化的新闻文章,提升整体用户体验。这种内容的定制确保用户收到与其偏好一致的信息。

  • 时间效率是另一个显著的优势。聊天机器人能够快速筛选大量信息,向用户呈现最相关的新闻文章。这种节省时间的方面对于那些否则必须手动搜索和过滤大量来源的用户特别有益。

https://hackernoon.com/querying-news-articles-via-a-streamlit-app-using-openai-langchain-and-qdrant-db?source=rss

AI 立大功!神经网络对太阳图像进行三维重建,首次揭示太阳极点

要点解析:

  • 科罗拉多州国家大气研究中心(NCAR)的研究人员利用NeRFs神经网络,将太阳的二维图像转换成三维重建图像,揭示了太阳的两极。极紫外辐射(EUV)是指波长在10~120 nm范围的太阳辐射,对近地轨道卫星大气阻力和人类健康有影响。通过SuNeRFs模型,他们实现了高准确度的太阳三维重建,为观测非黄道部分提供了解决方案。

  • 为解决EUV预测难题,研究团队选取了256张从均匀间隔的观测点拍摄的太阳前向模型图像,使用SuNeRFs神经网络进行算法训练。通过调整NeRFs模型以适应太阳的物理实际,他们成功地将二维图像转换为具有高质量的三维几何形状的重建图像,为太阳物理学研究提供了新的视角。

  • 太阳,作为地球最密切的恒星,一直是科研人员追寻的对象。通过夸父一号等探日卫星,中国在太阳物理研究领域取得了重要进展。夸父一号实现了三个首次,为我国在太阳物理研究领域的影响力提供了强有力的支持。

https://juejin.cn/post/7319669728813531148

商汤元萝卜光翼灯发布:国 AA 级标准、AI 光随书动,1699 元

要点解析:

  • 商汤科技旗下元萝卜品牌发布售价1699元的AI光翼灯。灯具采用流线型水滴设计,配备两个可折叠的“光翼”,ABS外壳+金属骨架,105°可调节双轴支架。

  • 元萝卜光翼灯符合国AA级照明标准,双重遮光设计,隐藏内置环形软灯带,底部光源磨砂处理,显色指数Ra > 95,支持无可视频闪。照度≥120lux时,光翼灯最大照射范围可达2.2㎡。

  • 该产品具备多项AI功能,包括自动调光、离座感应、App和按键控制、AI坐姿纠正、AI语音提醒、AI伴读、AI聚光灯、AI光随书动等。产品已在京东上架,标价1699元。

https://www.ithome.com/0/743/153.htm

PepHop AI登录

要点解析:

  • PepHop AI是一款颠覆性的平台,用户可以创建和与由AI驱动的聊天机器人角色互动,提供 engaging 和 unique 的对话体验。无论你想与一个时髦的动漫女孩、一位智者巫师,甚至是一个不安全的伴侣聊天,PepHop都能实现。

  • 登录PepHop的过程非常简单,只需两个信息:

    • 你的邮箱地址:在初始注册时提供的有效邮箱地址,成为后续访问PepHop时的主要用户名。

    • 你的密码:在初始注册时为账户创建的密码,每次登录时都需要输入。

  • 掌握邮箱和密码后,按照以下简单步骤操作:

    1. 进入PepHop AI网站。

    2. 点击右上角的“登录”按钮。

    3. 在第一个字段中输入你的邮箱地址。

    4. 在第二个字段中输入账户密码。

    5. 点击“登录”按钮完成过程。

  • 在简短的加载时间后,你将进入PepHop仪表板,完全访问你的聊天机器人!

  • PepHop还提供了重置密码的选项,如果忘记密码,可以通过邮箱轻松重置。

  • 登录后,主PepHop仪表板显示,提供关键功能的概览,包括已创建的聊天机器人、聊天记录和个人定制。

  • 主菜单允许进一步配置和个性化,包括创建、编辑视觉/个性和重新聊天,搜索所有聊天记录,管理订阅计划和账单明细,以及设置通用首选项和通知选项。

  • 登录过程标志着进入这个数字梦幻世界的入口,通过现在登录并探索PepHop AI的一切,开始充满趣味并让你的想象力奔放!

https://openaimaster.com/?p=31134

骁龙888实时运行,美团、浙大等打造全流程移动端多模态大模型MobileVLM

要点解析:

  • 美团、浙大等推出了在移动端部署的多模态大模型,包含了LLM基座训练、SFT、VLM全流程。MobileVLM是一款专为移动设备设计的视觉语言助手,结合了1.4B和2.7B参数的语言模型、CLIP预训练的多模态视觉模型,以及高效跨模态交互。性能媲美大型模型,展示了在移动端上部署多模态大模型的前景。

  • MobileVLM的总体架构包括视觉编码器、定制的LLM边缘设备(MobileLLaMA)、高效的映射网络(LDP),用于对齐视觉和文本空间。设计上注重在资源有限的边缘设备上实现高效的视觉感知和推理。MobileVLM经过广泛的消融实验,通过视觉骨干网络、VL映射网络、视觉分辨率和token数量等方面的调研,优化性能并保持推理速度。

  • 在移动设备上的延迟测试表明,MobileVLM在Realme GT手机和英伟达Jetson AGX Orin平台上表现出色,具备前所未有的速度。综合评估结果显示MobileVLM在多模态性能上与最先进的视觉语言模型相媲美,为移动设备上部署的多模态助手带来新的可能性。

https://www.jiqizhixin.com/articles/2024-01-03-5

如何免费使用Vizard AI?

要点解析:

  • Vizard AI是一款强大的在线视频编辑器,为任何人提供了像专业人士一样编辑视频的简便方式。具有直观的拖放工具、自动转录和字幕以及高级编辑功能,Vizard简化了视频后期制作。

  • Vizard提供了面向企业的付费计划,同时也提供了免费版本,允许您测试编辑器的核心功能。在本指南中,我们将介绍如何使用Vizard AI的免费视频编辑器。

  • 免费计划允许您每月上传最多60分钟的视频到Vizard编辑器中。此限额每月初重置。除了60分钟外,您需要升级到付费计划。

https://openaimaster.com/?p=31121

如何使用Curipod AI创作引人入胜的课程

要点解析:

  • Curipod AI是一款利用人工智能帮助教师创建互动引人入胜课程的新平台。通过Curipod的易于使用的界面,教育工作者可以在几分钟内生成创造性的课程内容,引导学生进行批判性思考和有意义的反思。本指南将探讨如何注册Curipod,使用AI生成课程想法,核实AI内容,并在课堂上负责任地应用Curipod的提供。

  • 使用Curipod快速简便,只需访问www.curipod.com并点击右上角的蓝色“注册”按钮。进入基于AI的课程工具的仪表板后,您可以从中访问Curipod的一整套工具。

  • Curipod的AI专为帮助教师制定深思熟虑、引人入胜的任何主题的课程计划而设计。通过进入Curipod仪表板上的“课程想法”选项卡,您可以输入与您想构建的课程相关的关键词,AI将即时提供各种创意提示、讨论问题、活动、评估等。Curipod的AI结果利用其庞大的数据库,提供新颖、符合学习标准并促进21世纪技能发展的想法。

https://openaimaster.com/?p=31157

deepin 深度操作系统推出“看图 AI 插件”,支持设备端“图像上色”“转换风格”等 8 大功能

要点解析:

  • deepin最新推出的AI插件包含8种AI修图功能。在风格转换方面,采用DCT-Net模型,仅需少量风格数据样本即可生成高保真、易拓展的图片内容。

  • 图片分辨率提升方面,插件基于Real-ESRGAN算法,通过多次降质模拟真实复杂降质,相较传统简单采样在处理低分辨率场景效果更佳。

  • 图片上色方面,引入SOTA图像上色算法,能快速将黑白图像转为彩色图像。插件已上架deepin应用商店,用户可通过命令直接安装。

https://www.ithome.com/0/743/151.htm

三星发布Galaxy S24神秘预告:迎接Galaxy AI时代

要点解析:

  • 三星电子将人工智能作为2024年实现更大规模销量的关键因素,计划在1月17日发布Galaxy S24,强调新品将注重AI功能。

  • 2024年有望成为“人工智能功能”占据智能手机中心位置的里程碑年份。全球AI技术发展预计将带动消费者硬件升级和全新基于AI的软件服务,智能手机有望融合AI大模型,引领科技行业趋势。

  • 智能手机厂商正努力将生成式AI工具和AI大模型集成到设备中,推动智能手机用户更高效、便捷、安全地使用AI功能。预计到2027年底,AI智能手机出货量将超过5亿部,2024年为关键元年,市场复合年增长率预计达83%。

https://m.cnbeta.com.tw/view/1408747.htm

AI时代数据应用的全链路工厂 - Chat2DB

要点解析:

  • 随着年末的临近,技术公司纷纷展开年终总结。绩效总结的关键在于实际数据,但业务同学常常面临获取数据的难题,导致频繁向开发人员请求,加重了开发同学的负担。为解决这一问题,本期开放麦邀请到 Chat2DB 作者姬朋飞,他分享了业务同学和开发同学在数据处理方面的困境以及如何利用 Chat2DB 解决这些问题。

  • 在年终总结时,业务同学需要准备大量业务汇报和结果分析,却不擅长获取业务数据。开发同学则面临项目 deadline 和被频繁要求提供数据的窘境。为应对这一矛盾,姬朋飞介绍了 Chat2DB 作为解决方案的秘密武器,让业务同学不再追着开发人员要数据,同时减轻了开发同学的工作负担,实现了更高效的数据协同。

https://juejin.cn/post/7319410253661061154

利用ChatGPT打工人完成掘金年度打榜直播的抽奖

要点解析:

  • 本文介绍了如何使用ChatGPT构建抽奖助手,并详细说明了实现过程。首先,作者准备了三个工具:ChatGPT Plus账号、Google Cloud账号和AirCode.io账号。接着,配置了Google Sheets,包括授权和实现操作Google Sheets的API。

  • 技术实现部分包括创建GPTs、配置Instructions和Actions,以及提供三个API用于抽奖:/index、/prices和/winners。其中,Instructions明确定义了ChatGPT的角色和任务,而Actions则为ChatGPT提供具体的API路径和操作。

  • 最后,作者展示了抽奖助手的完整实现过程,包括在AirCode.io上发布API,创建GPTs,配置API路径和发布GPTs。整篇文章通过步骤详细解释,使读者能够轻松理解构建抽奖助手的全过程。

https://juejin.cn/post/7319541678272151602

Jenni AI登录流程及使用

要点解析:

  • Jenni AI是一款创新的人工智能写作助手,旨在帮助内容创作者、营销人员和专业人士提升写作技能。具备先进的自然语言处理能力,提供实时写作建议、语法和风格修正以及整体内容优化。

  • 通过Jenni AI账户,用户可以迅速开始使用这款AI写作助手,并了解其关键功能,包括实时写作建议、语法和风格检查以及整体内容优化。详细的登录步骤和主要功能使用户能够充分利用Jenni AI提升他们的写作水平。

  • Jenni AI的关键功能包括解决写作障碍、提供文章和内容结构建议、进行语法和风格修正以及分析可读性和语调。这些功能不仅有助于克服写作困难,还能够在不同行业的写作任务中提高创作效率和质量。

https://openaimaster.com/?p=31142

什么是不眠AI币?创新的游戏方式

要点解析:

  • Sleepless AI是一项雄心勃勃的项目,旨在通过整合人工智能和区块链技术改变游戏行业。其核心是Sleepless AI币,这是支持去中心化伴侣游戏平台的加密代币。

  • Sleepless AI币(SLE)是Sleepless AI生态系统的本机实用令牌,构建在Binance智能链上,利用BEP-20标准提供的快速和低成本交易。持有SLE代币的人可以访问Sleepless AI平台提供的功能和服务,包括通过AI伴侣提供的情感支持服务、参与元宇宙事件和游戏、通过投票权治理平台、质押奖励等。

  • Sleepless AI通过整合VR技术和元宇宙,提供沉浸式游戏体验。用户可以参与事件,与社区其他成员交流,享受互动故事,并与他们的AI伴侣一起探索广阔的虚拟世界。SLE代币是Sleepless元宇宙中提供的所有服务的互操作性令牌,它是一种跨宇宙的货币,提供对所有情感支持服务、游戏、头像、虚拟物品等的访问。

https://openaimaster.com/?p=31139

高情商的NPC来了,刚伸出手,它就做好了要配合下一步动作的准备

要点解析:

  • 在虚拟现实、增强现实和游戏等领域,人机互动是关键,尤其是涉及虚拟人物和物体互动的实时任务。研究专注于在线全身动作反应合成,通过人类动作生成虚拟人的动态反应,涉及人物和物体的复杂互动。作者构建了两个数据集,HHI和CoChair,以支持这一新任务,并提出了一种统一方法,有效实现高质量反应动作和实时推理。

  • 为了实现在线全身动作反应合成,研究采用了社交可供性表示,通过编码人类与虚拟人或物体的接触信息。作者定义了以载体为中心的社交可供性表示,通过学习局部坐标系和动作密集编码,简化了表达空间。社交可供性预测模块被引入,使虚拟人能够预测人类行为并做出相应决策。实验证明该方法在多个数据集上表现优越,实时推理速度可达25 FPS。

  • 综合而言,研究聚焦于提高虚拟人与人类的社交体验,通过创新性的在线全身动作反应合成任务和相关方法,为虚拟现实和人机交互领域注入了新的活力。

https://www.jiqizhixin.com/articles/2024-01-03-4

全新AI工具OpenVoice:轻松免费实现语音克隆

要点解析:

  • 一项开创性的AI技术发展横空出世,名为OpenVoice的开源语音克隆模型由麻省理工学院(MIT)、清华大学和加拿大人工智能初创公司MyShell合作开发而成。这一创新工具使用户能以非凡的精度和控制克隆声音。

  • 与其他需要大量开发资金的专有算法和软件不同,OpenVoice以其近乎即时的克隆能力和详细的控制选项脱颖而出。它允许用户仅使用小音频片段就能调整声音的各个方面,包括语调、情感、口音、韵律和语调,这在现有的语音克隆平台中并不常见。

  • OpenVoice的发布伴随着详细介绍其开发的研究论文。它可在MyShell的Web应用界面和HuggingFace上使用,提供广泛的可访问性。这是一个标志性的AI语音技术进展,展示了AI在语言、视觉和声音模式中的潜力,并为更具普遍性和多功能性的语音克隆应用铺平了道路。

https://www.greataiprompts.com/?p=6044

如何使用Perchance AI图像生成器

要点解析:

  • Perchance AI图像生成器是一款免费在线工具,利用人工智能从文本描述中生成独特的图像。只需几个词,您就可以生成高质量的照片、艺术品、标志或任何您想象得到的东西。

  • 使用生成器简单易行,无需任何技术技能或设计经验。只需三个简单的步骤,您就可以获得根据您需求定制的人工智能生成的图像。

  • 要获得好的输出,关键在于编写详细的、描述性的提示。包括颜色、风格、纹理、光照和传达您想要的任何其他细节。不要依赖人工智能来解释模糊的提示。

https://openaimaster.com/?p=31126

科技部发文规范AI使用,禁止AIGC直接生成申报材料

要点解析:

  • 科技部监督司发布《负责任研究行为规范指引(2023)》,明确科研人员及单位在研究选题、数据管理、成果署名、同行评议、伦理审查等方面应遵循的科学道德准则。

  • 指引明令禁止使用生成式人工智能直接生成申报材料,并要求科研人员贯穿科技伦理要求于整个研究活动。突破性研究成果的发布需经科研单位同意,未经验证的成果不得传播,已发表论文不得拼凑再发表。

  • 指引要求科技伦理审查覆盖涉及人、动物、生命健康、生态环境等伦理风险的科技活动,并强调在紧急状态下的科技活动需遵守应急审查程序,不得回避或降低科技伦理审查标准。

https://www.ithome.com/0/743/159.htm

骁龙888实时运行,美团、浙大等打造全流程移动端多模态大模型MobileVLM

要点解析:

  • 美团、浙大等推出了在移动端部署的多模态大模型,包含了LLM基座训练、SFT、VLM全流程。MobileVLM是一款专为移动设备设计的视觉语言助手,结合了1.4B和2.7B参数的语言模型、CLIP预训练的多模态视觉模型,以及高效跨模态交互。性能媲美大型模型,展示了在移动端上部署多模态大模型的前景。

  • MobileVLM的总体架构包括视觉编码器、定制的LLM边缘设备(MobileLLaMA)、高效的映射网络(LDP),用于对齐视觉和文本空间。设计上注重在资源有限的边缘设备上实现高效的视觉感知和推理。MobileVLM经过广泛的消融实验,通过视觉骨干网络、VL映射网络、视觉分辨率和token数量等方面的调研,优化性能并保持推理速度。

  • 在移动设备上的延迟测试表明,MobileVLM在Realme GT手机和英伟达Jetson AGX Orin平台上表现出色,具备前所未有的速度。综合评估结果显示MobileVLM在多模态性能上与最先进的视觉语言模型相媲美,为移动设备上部署的多模态助手带来新的可能性。

https://www.jiqizhixin.com/articles/2024-01-03-5

deepin 深度操作系统推出“看图 AI 插件”,支持设备端“图像上色”“转换风格”等 8 大功能

要点解析:

  • deepin最新推出的AI插件包含8种AI修图功能。在风格转换方面,采用DCT-Net模型,仅需少量风格数据样本即可生成高保真、易拓展的图片内容。

  • 图片分辨率提升方面,插件基于Real-ESRGAN算法,通过多次降质模拟真实复杂降质,相较传统简单采样在处理低分辨率场景效果更佳。

  • 图片上色方面,引入SOTA图像上色算法,能快速将黑白图像转为彩色图像。插件已上架deepin应用商店,用户可通过命令直接安装。

https://www.ithome.com/0/743/151.htm

Python函数参数的全面指南

要点解析:

  • Python函数中,参数的灵活运用至关重要。通过位置、关键字和默认参数,开发者可以为函数定制各种需求。参数是我们在调用函数时传递给它的值,为函数执行任务提供必要的输入。Python支持不同类型的函数参数,包括位置参数、关键字参数和任意参数。

  • 位置参数 是最基本的函数参数类型,按照定义顺序传递。函数可以有一个或多个位置参数,通过在函数签名中指定名称定义。例如:

python

def greet(name):

print(f"Hello, {name}!")

greet("Alice")

在这个例子中,greet 函数接受一个位置参数 name,当我们调用函数并传递参数 "Alice" 时,它打印出 "Hello, Alice!"。

  • 关键字参数 是另一种Python函数参数类型,通过名称而非位置标识。函数可以有一个或多个关键字参数,通过在函数签名中指定名称和默认值定义。例如:

python

def greet(name="World"):

print(f"Hello, {name}!")

greet() # 输出: Hello, World!

greet(name="Alice") # 输出: Hello, Alice!

在这个例子中,greet 函数有一个关键字参数 name,默认值为 "World"。在调用函数时,如果不提供参数,它使用默认值打印 "Hello, World!";如果提供参数,如 "Alice",则使用提供的值打印 "Hello, Alice!"。

  • 任意参数 允许函数接受可变数量的参数,分为 *args(可变长度的位置参数)和 **kwargs(可变长度的关键字参数)。这对于需要处理不确定数量参数的情况非常有用。例如:

python

def add_numbers(*args):

total = 0

for num in args:

total += num

return total

result = add_numbers(1, 2, 3, 4, 5)

在这个例子中,add_numbers 函数使用 *args 语法接受任意数量的位置参数,将它们汇总并返回总和。

https://www.analyticsvidhya.com/blog/2024/01/a-comprehensive-guide-to-python-function-arguments/

60+你必须牢记的生成AI术语

要点解析:

  • 人工智能与机器学习领域的详尽指南,涵盖从代理和AGI到零样本学习等方方面面。这些生成式AI术语旨在为您提供简明的解释和生动的示例,无论您是经验丰富的从业者还是好奇的新手,都希望成为您的AI领域参考。

  • 代理、AGI(通用人工智能)、对齐、注意力机制、自动编码器等,这些是AI领域的关键术语。代理是能够独立感知和行动以实现目标的软件机器人,而AGI则是能够理解和学习任何人类智力任务的假想AI。对齐则涉及确保AI的目标和价值与人类价值相容,防止有害或意外后果。注意力机制在神经网络中选择性地关注输入数据的重要部分,类似于在拥挤的对话中专注于特定的说话者。

  • 深度学习的背后是Back Propagation、BigGAN、数据增强、Diffusion Models等算法和技术。Back Propagation是神经网络学习的算法,BigGAN是以生成逼真高分辨率图像而闻名的生成对抗网络类型。数据增强人为增加训练数据的数量和多样性,而Diffusion Models则通过逐渐添加和反转噪音生成数据的新技术。

https://www.analyticsvidhya.com/blog/2024/01/generative-ai-terms/

面向超长上下文,大语言模型如何优化架构,这篇综述一网打尽了

要点解析:

  • 长文探讨基于 Transformer 的大型语言模型(LLM)在优化长上下文能力方面的最新进展。ChatGPT的诞生为通用人工智能(AGI)应用提供了革命性的可能性,但当前主要受限于在短文本上的预训练,导致在长上下文处理方面表现较差。

  • 论文细致分析了处理长上下文输入和输出的问题,并提出了一套分类体系指导基于 Transformer 的模型升级。从高效注意力、长期记忆、外推性位置编码、上下文处理到各类改进方法,全面梳理了提升LLM在长上下文场景中表现的各种策略和方法。

  • 未来方向包括解决注意力复杂度、记忆效果和效率、长度外推挖掘等问题。提出对特定但通用目标的需求,以及更可靠的度量方法的迫切性。综合评述了当前进展和未来挑战,为基于 Transformer 的LLM在长上下文能力方面的发展指明了方向。

https://www.jiqizhixin.com/articles/2024-01-03-3

免费在线进行AI吸引力测试

要点解析:

  • 人工智能已深入生活,多个免费在线平台利用AI评估面部吸引力。这些测试声称通过分析面部特征和比例提供吸引力评分和见解。本文探讨了AI面部吸引力测试的能力和局限性。

  • AI吸引力测试是使用人工智能算法评估面部吸引力的自动化在线平台。这些测试通常要求用户上传面部照片,然后通过计算机视觉和机器学习模型进行分析,为面部分配吸引力评分。

  • 这些测试的常见特征包括吸引力评分、面部特征分析、与名人或模特的比较、改善建议等。然而,它们在准确性、公正性和泛化性方面仍有改进空间。

https://openaimaster.com/?p=31154

《自然》关注:AI读片或是阿尔茨海默病诊断新希望!人工智能算法准确率已超过90%

要点解析:

  • 阿尔茨海默病(AD)的早期诊断一直是临床难题,认知障碍出现时,通常已错过最佳干预窗口。生物标记物如脑脊液和PET提高了诊断敏感性和特异性,但侵入性和可及性限制了其在临床中的应用。近期的研究指出,基于大规模MRI数据的深度学习方法,特别是一项使用Inception-ResNet-V2模型的研究,在AD诊断上取得了显著成果。该模型经过迁移学习后,在多个数据集上展现了超过90%的准确度。

  • 该研究使用了超过8万份MRI样本构建的深度卷积神经网络模型,性别分类器准确度达到94.9%。经过迁移学习用于AD诊断,该模型在交叉验证中达到90.9%的准确度,并在多个unseen独立数据集上保持90%以上的测试精确度。此外,该模型在MCI数据集中预测了MCI向AD的转化,展现出对早期诊断的潜力。

  • 通过充分利用大规模数据集和迁移学习,这项研究为AD的早期诊断提供了新的思路,展示了深度学习在神经影像学领域的潜力,为未来临床应用奠定了基础。

http://www.199it.com/?p=1663314

AAAI 2024 Fellow公布,清华大学朱军教授入选

要点解析:

  • 朱军教授成为AAAI 2024年度 Fellow,以其在概率机器学习和深度神经网络领域的卓越贡献获此殊荣。朱军教授长期致力于研究贝叶斯方法的基础理论、高效算法,以及深度学习在复杂环境中的决策学习等问题。他带领团队开发的深度概率编程库「珠算」和强化学习库「天授」等项目在相关领域产生深远影响,其中扩散模型高效算法更荣获ICLR 2022国际会议杰出论文奖。

  • AAAI 2024年度Fellow共有12位学者入选,包括对共指消解、不平衡数据学习、人机交互等领域做出显著贡献的Claire Cardie、Nitesh Chawla、Cristina Conati等。他们的研究推动了人工智能理论和应用的发展,为该领域注入新的思想和方法。

  • AAAI Fellow是AAAI颁发的最高荣誉,代表着对过去十年在人工智能领域做出非同寻常卓越贡献者的认可。这一殊荣严格评选,每年限定入选人数,被誉为国际人工智能领域的名人堂。

https://www.jiqizhixin.com/articles/2024-01-03-7

哈佛校长辞职:涉嫌学术不端,史上任期最短

要点解析:

  • 哈佛大学校长克洛迪娜・盖伊因学术抄袭丑闻和争议升级宣布辞职。她任职仅6个月,是哈佛历史上任期最短的校长。盖伊在去年的听证会中因立场模糊而受到批评,最终辞职是受到多方面压力的结果。

  • 争议加剧主要源于盖伊在学术领域的问题,包括被指控的学术抄袭,论文中缺少引号和引文,以及对以色列问题的不明确表态。她的辞职引发了学术界和社会的广泛关注,哈佛大学声誉或因此受损。

  • 哈佛董事会支持盖伊,宣布经济学家兼医生艾伦・M・加伯将担任临时校长。盖伊将继续担任教职,但争议可能对哈佛招生产生影响,提前批录取学生数量下降约17%。

https://www.jiqizhixin.com/articles/2024-01-03-6

高情商的NPC来了,刚伸出手,它就做好了要配合下一步动作的准备

要点解析:

  • 在虚拟现实、增强现实和游戏等领域,人机互动是关键,尤其是涉及虚拟人物和物体互动的实时任务。研究专注于在线全身动作反应合成,通过人类动作生成虚拟人的动态反应,涉及人物和物体的复杂互动。作者构建了两个数据集,HHI和CoChair,以支持这一新任务,并提出了一种统一方法,有效实现高质量反应动作和实时推理。

  • 为了实现在线全身动作反应合成,研究采用了社交可供性表示,通过编码人类与虚拟人或物体的接触信息。作者定义了以载体为中心的社交可供性表示,通过学习局部坐标系和动作密集编码,简化了表达空间。社交可供性预测模块被引入,使虚拟人能够预测人类行为并做出相应决策。实验证明该方法在多个数据集上表现优越,实时推理速度可达25 FPS。

  • 综合而言,研究聚焦于提高虚拟人与人类的社交体验,通过创新性的在线全身动作反应合成任务和相关方法,为虚拟现实和人机交互领域注入了新的活力。

https://www.jiqizhixin.com/articles/2024-01-03-4

复杂陌生的句子让大脑语言网络更加努力

要点解析:

  • 通过人工语言网络的帮助,MIT神经科学家发现了能激活大脑关键语言处理中心的句子类型。

  • 研究揭示了由于不寻常的语法或意义而更复杂的句子在这些语言处理中心产生更强烈的反应。简单直接的句子几乎不引起这些区域的活跃,而荒谬的词序对它们也没有太大影响。

  • 例如,研究发现,在阅读像来自名为C4的公开语言数据集的句子这样不寻常的句子时,大脑网络最为活跃,但在阅读非常直接的内容时,比如“我们坐在沙发上”,大脑网络安静下来。

https://news.mit.edu/2024/complex-unfamiliar-sentences-brains-language-network-0103