「TMV」- 人工智能 | AI | Artificial intelligence

认识

人工智能:是研究、开发用于模拟、延伸和扩展人的智能的理论、方法及应用系统的一门新的技术科学。

组成

机器学习:研究计算机模拟或实现人类的学习行为,以获取更多的知识。是人工智能的核心研究领域之一。

深度学习:源于人工神经网络的研究,多层感知器就是一种深度学习结构。深度学习是机器学习研究中的一个新的领域,它模仿人脑的机制来解释数据,例如图像、声音和文本识别。

LLM | Large Language Model | A large language model (LLM) is a type of machine learning model designed for natural language processing tasks such as language generation. LLMs are language models with many parameters, and are trained with self-supervised learning on a vast amount of text.

The largest and most capable LLMs are generative pretrained transformers (GPTs).

Model Context Protocol (MCP)

Model Context Protocol (MCP) is an open protocol that enables seamless integration between LLM applications and external data sources and tools. Whether you’re building an AI-powered IDE, enhancing a chat interface, or creating custom AI workflows, MCP provides a standardized way to connect LLMs with the context they need.

MCP is an open protocol that standardizes how applications provide context to LLMs. Think of MCP like a USB-C port for AI applications. Just as USB-C provides a standardized way to connect your devices to various peripherals and accessories, MCP provides a standardized way to connect AI models to different data sources and tools.

https://github.com/modelcontextprotocol/servers
https://modelcontextprotocol.io/introduction

https://mcp.so/

构建

awesome-chatgpt/README.zh-cn.md at main · OpenMindClub/awesome-chatgpt

microsoft/visual-chatgpt: Official repo for the paper: Visual ChatGPT: Talking, Drawing and Editing with Visual Foundation Models

Lunabot – ChatGPT on any webpages
https://chrome.google.com/webstore/detail/lunabot-chatgpt-on-any-we/jkeolmadidncndcbnajhaojepbolajag

Dify | https://docs.dify.ai/zh-hans
是一款开源的大语言模型(LLM) 应用开发平台。它融合了后端即服务(Backend as Service)和 LLMOps 的理念,使开发者可以快速搭建生产级的生成式 AI 应用。即使你是非技术人员,也能参与到 AI 应用的定义和数据运营过程中。你或许可以把 LangChain 这类的开发库(Library)想象为有着锤子、钉子的工具箱。与之相比,Dify 提供了更接近生产需要的完整方案,Dify 好比是一套脚手架,并且经过了精良的工程设计和软件测试。

Stable Diffusion | https://stability.ai/stable-image
是一种AI绘画生成工具。Stability AI 于2023年6月发布新闻稿,宣布推出 SDXL 0.9 版本更新,升级了 Stable Diffusion 文本生成图片模型。

LLM

DouBao | 豆包 | 抖音 | AI 智能助手 | https://www.doubao.com/chat/

  • 豆包是字节跳动公司基于云雀模型开发的 AI 工具,提供聊天机器人、写作助手以及英语学习助手等功能,它可以回答各种问题并进行对话,帮助人们获取信息,支持网页 Web 平台,iOS 以及安卓平台。

DeepSeek | https://chat.deepseek.com

Kimi | https://kimi.moonshot.cn/

通义 https://tongyi.aliyun.com

AI Agent

Manus | https://manus.im/

OpenManus | https://github.com/mannaandpoem/OpenManus

Browser Use | https://github.com/browser-use/browser-use

OWL | https://github.com/camel-ai/owl |Optimized Workforce Learning for General Multi-Agent Assistance in Real-World Task Automation

AutoGPT | https://github.com/Significant-Gravitas/AutoGPT | AutoGPT is a powerful platform that allows you to create, deploy, and manage continuous AI agents that automate complex workflows.

AgentGPT | https://github.com/reworkd/AgentGPT
AgentGPT allows you to configure and deploy Autonomous AI agents. Name your own custom AI and have it embark on any goal imaginable. It will attempt to reach the goal by thinking of tasks to do, executing them, and learning from the results 🚀.

搜索引擎

文档 Embedding 问答类网站已经卷的不行了,这个叫 Chatbase 的产品,它不仅支持 pdf,还支持文本、网页等各种数据,然后每一个数据可以有一个单独的 url,你可以分享出去让其他人一起用,并且别人不需要登录就可以使用。

https://chatbase.co

Coze | 扣子 | 字节跳动 | 一站式 AI 开发平台 | https://www.coze.cn/home

Coze 扣子支持 30 秒无代码生成 AI Bot,集成了超过 60 种不同的插件,覆盖新闻阅读、旅行规划、生产力工具等多个领域,用户可以根据需求快速为机器人添加功能。同时,扣子还支持一键分享至微信、飞书等社交平台,让更多人使用到自己创建的 Chatbot。

Microsoft Copilot | https://www.microsoft.com/en-us/microsoft-copilot

程序开发

豆包 | MarsCode | https://docs.marscode.cn/docs/introduction

1)生成 Commit log,这是 ChatGPT 的强项,它能够快速理解逻辑和代码,通过 diff 归纳出概要,开源的工具有:https://github.com/zurawiki/gptcommit%E2%80%A6

2)生成测试用例,团队内实践下来效果相当好。虽然 Copilot 和 Tabnine 等产品在代码自动补全方面已经表现不错,但相较于 https://codeium.comhttps://cursor.so 这些能够使用自然语言生成代码的体验,还是稍逊一筹。之所以不生成业务代码,是因为生成业务代码需要理解产品逻辑,而编写单元测试只需理解一个函数。

3)生成 API 文档和代码注释,ChatGPT 可以通过阅读代码,理解函数的输入、输出、功能以及用途,然后生成相应的 API 文档和注释,开源的工具:https://github.com/awekrx/AutoDoc-ChatGPT%E2%80%A6

4)生成 SQL,已经看到 PingCAP 发布了相关产品 chat2query,对公司产品、运营等有数据需求但不懂数技术的岗位非常友好。https://pingcap.com/chat2query-an-innovative-ai-powered-sql-generator-for-faster-insights/

5)自动代码审查和漏洞检测,ChatGPT 可以分析代码中的潜在问题,包括代码风格不一致、程序逻辑错误或安全漏洞等。这个能力其实在 http://cursor.so 这个产品中就已经具备了,无需等到提交代码,在本地可以直接让程序先完成一轮 CR。

性质

WIP

应用

⚫人工智能的四要素是数据、算法、算力、场景。为满足四要素,AI将与云计算、大数据和物联网等产业结合。
⚫网络在AI产业的定位是提供计算间的高速通信。

该笔记将记录:与 AI 相关的内容,以及相关问题解决方案;

Automated journalism

Wikipedia/Automated journalism
An AI helped us write this article

YoloV8

YoloV8 是一种深度学习算法,用于对象检测和识别任务。YoloV8 是 You Only Look Once(YOLO)的第 8 个版本,它是 YOLO 系列中的最新版本;

YoloV8 使用卷积神经网络(CNN)来进行对象检测和识别,它具有高效性和准确性。与其他对象检测算法相比,YoloV8 可以实现实时检测和识别;

YoloV8 的主要功能是检测和识别图像中的对象。它可以识别多个对象,并将它们标记为不同的类别,例如人、车、动物等。在识别对象时,YoloV8 还可以提供对象的位置和大小信息;

YoloV8 还可以在视频流中进行对象检测和识别。它可以实时检测和识别视频中的对象,并跟踪它们的运动轨迹。这使得 YoloV8 在实时监控和安全领域中广泛应用;

总的来说,YoloV8 是一种高效、准确、实时的对象检测和识别算法,它具有广泛的应用前景;

作为 AI 芯片,YoloV8 支持的硬件类型包括 CPU、GPU 和 FPGA。其中,GPU 是最常用的硬件加速器,可以提供比 CPU 更快的计算速度;FPGA 则是一种可编程逻辑芯片,可以根据具体应用场景进行定制化设计,提供更高的灵活性和性能。另外,YoloV8 还支持一些专用的 AI 加速卡,如 NVIDIA Tesla 和 Intel Movidius 等;

参考文献

Wikipedia/Artificial intelligence