文章目录介绍摘要创新点请阅读下文:文章链接核心代码YOLOv8引入下载YoloV8代码直接下载安装环境引入代码导包修改 class BboxLoss修改ultralytics/yolo/utils/tal.py...
-
论文阅读 目标检测 【YOLOv8改进】MPDIoU:有效和准确的边界框损失回归函数 (论文笔记+引入代码)
-
论文阅读 目标检测 【YOLOv8改进】iRMB: 倒置残差移动块 (论文笔记+引入代码).md
介绍摘要本论文旨在开发现代、高效、轻量的密集预测模型,并在参数、浮点运算次数与性能之间寻求平衡。虽然倒置残差块(IRB)是轻量级卷积神经网络(CNN)的重要基础,但在基于注意力的研究中尚缺类似的构件。本研究从统一视角出发,结...
-
论文阅读 深度学习 人工智能 【论文笔记】AK卷积(Convolutional Kernel with Arbitrary Sampled Shapes and Arbitrary Number of Parameters)
本文介绍AK卷积,传统的卷积有2个缺陷:1、卷积运算在固定大小的窗口运行、无法捕获其他窗口的信息,并且窗口的形状是固定的;2、卷积核的尺寸固定为,窗口大小固定为k,随着k增加,参数会快速增加。针对传统卷积的缺陷,作者提出了A...
-
论文阅读 microsoft 【YOLOv8改进】 MSDA:多尺度空洞注意力 (论文笔记+引入代码).md
介绍摘要作为事实上的解决方案,标准的视觉变换器(ViTs)被鼓励模拟任意图像块之间的长距离依赖性,而全局关注的接受域导致了二次计算成本。视觉变换器的另一个分支受到CNNs启发,利用局部注意力,只模拟小邻域内块之间的交互。尽管...
-
论文阅读 深度学习 神经网络 【论文笔记】FasterNet:Run, Don’t Walk: Chasing Higher FLOPS for Faster Neural Networks
文章目录前言1. 介绍2. 简单介绍以下深度可分离卷积3. PConv3.1 部分卷积PConv的设计3.2 PConv 之后的 Point-Wise Convolution3.3 PConv的代码4. 基于PConv的视觉...
-
机器学习 深度学习 人工智能 【论文阅读】Usenix Security 2023 你看不见我:对基于激光雷达的自动驾驶汽车驾驶框架的物理移除攻击
文章目录一.论文信息二.论文内容1.摘要2.引言3.作者贡献4.主要图表5.结论一.论文信息论文题目: You Can’t See Me: Physical Removal Attacks on LiDAR-based Au...
-
论文阅读 深度学习 神经网络 论文笔记:PhaseNet: a deep-neural-network-based seismic arrival-time pickingmethod
地震检测和定位是地震学的基础。地震目录的质量主要取决于到达时间测量的数量和准确性。地震到达时间测量或相位选择通常由网络分析员执行,他们根据专家判断和多年经验选择相位。随着地震仪部署速度的不断加快; 网络分析员分析的速度跟上数...
-
语言模型 文心一言 论文阅读 数据分析 nlp 文档向量化工具(一):Apache Tika介绍
Apache Tika是什么?能干什么?Apache Tika是一个内容分析工具包。该工具包可以从一千多种不同的文件类型(如PPT、XLS和PDF)中检测并提取元数据和文本。所有这些文件类型都可以通过同一个接口进行解析,这使...
-
论文阅读 语言模型 人工智能 论文笔记:Teaching Large Language Models to Self-Debug
ICLR 2024 REVIEWER打分 66661 论文介绍论文提出了一种名为 Self-Debugging 的方法,通过执行生成的代码并基于代码和执行结果生成反馈信息,来引导模型进行调试不同于需要额外训练/微调模型的方法...
-
论文阅读 学习 经验分享 笔记 2023深圳杯(东三省)数学建模C题 - 无人机协同避障航迹规划(论文+代码+思路)
摘要本文主要研究了无人机在特定环境下的航线优化问题,我们通过数学模型和优化算法,实现了无人机飞行时间的最小化,进一步提升了无人机的作业效率。具体研究问题包括无人机在指定速度和指定距离条件下的最优航线选择,以及参数变化对最优航...
-
论文阅读
摘要像人一样,LLM也不能一次尝试就能产生最好的结果。受启发与人类精炼写作的过程,本文提出self-refine的方法。该方法LLM,通过内部的反馈和精炼机制来提升模型最初的输出结果。这个方法的主要idea是,用LLM先生成...
-
论文阅读 python 机器学习 人工智能 神经网络 pytorch [论文笔记]ITRANSFORMER: INVERTEDTRANSFORMERSARE EFFECTIVEFORTIMESERIESFORECASTING
文章地址:iTransformer_pdf code地址:github 文章是阅读论文后的个人总结,可能存在理解上的偏差,欢迎大家一起交流学习,给我指出问题。1、问题描述之前的工作DLinear和NLinear验证了线性模型...
-
[TCSVT论文阅读]Plain-PCQA: No-Reference Point Cloud Quality Assessment by Analysis of Plain Visual
论文中文题目:Plain-PCQA:通过分析纯视觉和几何组件,进行无参考点云质量评估。 论文作者单位:宁波大学摘要:在回顾点云质量评估(PCQA)的研究进展时,出现了两个主要的路径,即2D投影和3D点描述符。前者主要关注视觉...
-
论文阅读 论文笔记:Deep Learning for Trajectory Data Management and Mining: A Survey and Beyond
对应的github:yoshall/Awesome-Trajectory-Computing: A professional list of Deep Learning and Large (Language Models...
-
深度学习 人工智能 论文阅读:FCB-SwinV2 Transformer for Polyp Segmentation
这是对FCBFormer的改进,我的关于FCBFormer的论文阅读笔记:论文阅读FCN-Transformer Feature Fusion for PolypSegmentation-CSDN博客1,整体结构依然是一个双...
-
论文阅读 目标检测 【YOLOv8改进】Shape-IoU:考虑边框形状与尺度的指标(论文笔记+引入代码)
介绍摘要 作为检测器定位分支的重要组成,边框回归损失在目标检测任务中发挥巨大作用。现有的边框回归方法,通常考虑了GT框与预测框之间的几何关系,通过使用边框间的相对位置与相对形状等计算损失,而忽略了边框其自身的形状与尺度等固...
-
论文阅读:All4One=Symbiotic Neighbour Contrastive Learning via Self-Attention and Redundancy Reduction
ICCV2023: Imanol G. Estepa et.al. solo-learn 上刷榜的最新自监督表征学习我必须要吐槽这篇论文的公式写得依托… log exp不正体,括号不分大小,矩阵向量元素大小写不分摘要基于最近...
-
自然语言处理 论文阅读 AIGC 弱监督学习 深度学习 论文笔记 llama 【ACL 2023-NER注入到PLM】数据集+实验解读:基于上下文学习的命名实体识别 Learning In-context Learning for Named Entity Recognitio
【ACL 2023-NER注入到PLM】数据集+实验解读:基于上下文学习的命名实体识别 Learning In-context Learning for Named Entity Recognition写在最前面数据集四个数...
-
论文阅读 目标检测 【YOLOv8改进】 SPD-Conv空间深度转换卷积,处理低分辨率图像和小对象问题 (论文笔记+引入代码)
介绍摘要卷积神经网络(CNNs)在许多计算机视觉任务中取得了巨大成功,例如图像分类和目标检测。然而,当面对图像分辨率低或对象较小的更加困难的任务时,它们的性能迅速下降。在本文中,我们指出这一问题根源于现有CNN架构中一个有缺...
-
人工智能 论文阅读 chatgpt 大数据 ai写作哪个软件好用?ai扩图软件
论文大纲作为论文的纲要和导航,其重要性不言而喻。幸运的是,借助AI PaperPass这一工具,我们可以轻松获得免费的论文大纲,为我们的论文写作提供有力的指导和支持。▼输入【学科】+【论文题目】+【字数】AI论文,免费大纲,...
-
论文阅读 综述《Unifying Large Language Models and Knowledge Graphs: A Roadmap》统一大语言模型和知识图谱笔记
文章目录概述KG-enhanced LLMsKG-enhanced LLM pre-trainingKG-enhanced LLM inferenceKG-enhanced LLM interpretabilitySYNER...
-
个人论文阅读记录模版Notion版
个人论文阅读模版Notion版分享,整理阅读过的论文信息,方便复盘,求给点论文阅读和复盘的建议! 链接:https://deep-pomelo-cef.notion.site/3a0d19c85026456d9242f676...
-
论文阅读 《Vision mamba》论文笔记
原文出处:原文笔记:我们提出了 Vision Mamba (Vim ,Vim是一种基于纯SSM的方法,并以序列方式对图像进行建模,它结合了双向 SSM 用于数据相关的全局视觉上下文建模和位置嵌入以进行位置感知视觉理解。以前的...
-
FPN特征金字塔 FPN自上而下层 【论文阅读总结】用于目标检测的特征金字塔网络(FPN)
1.摘要2.引言2.1 低级特征对于检测小物体很重要2.2 算法目标3. 文献综述3.1 Hand-engineered features and early neural networks3.2 Deep ConvNet...
-
论文阅读 深度学习 计算机视觉 论文笔记:Efficient Deep Visual and Inertial Odometry with Adaptive Visual Modality Selection
文章目录前言一、方法1.视觉模态选择策略2.Gumbel-Softmax训练3.损失函数前言说在前面:本人是个菜鸡,纯菜鸡,以下我的理解绝对会有错误,欢迎指正共同进步! 文章题目:Efficient Deep Visual...
-
论文阅读 深度学习 论文笔记:DiffWave: A Versatile Diffusion Model for Audio Synthesis
论文笔记:DiffWave: A Versatile Diffusion Model for Audio Synthesis以往的波形模型大多着眼于带有信息的局部调节器的音频合成任务,只有很少的一部分关注无条件生成;自回归模...
-
论文阅读 文本匹配 [论文笔记]SiameseNet
引言这是Learning Text Similarity with Siamese Recurrent Networks的论文笔记。论文标题意思是利用孪生循环神经网络学习文本相似性。什么是孪生神经网络呢?满足以下两个条件即可...
-
【Spatial-Temporal Action Localization(七)】论文阅读2022年
文章目录1. TubeR: Tubelet Transformer for Video Action Detection摘要和结论引言:针对痛点和贡献模型框架TubeR Encoder:TubeR Decoder:Task-...
-
【论文阅读】Vision Mamba:双向状态空间模型的的高效视觉表示学习
文章目录Vision Mamba:双向状态空间模型的的高效视觉表示学习摘要介绍相关工作用于视觉应用的状态空间模型方法准备视觉MambaVim块结构细节高效分析计算效率实验图片分类语义分割目标检测和实例分割消融实验双向SSM分...
-
基于频率增强的数据增广的视觉语言导航方法(VLN论文阅读)
基于频率增强的数据增广的视觉语言导航方法(VLN论文阅读)本文提出的方法很简单,将原始图像增加其他随机图像的高频信息,得到增强的图像作为新的样本,与原始的样本交替训练。背后的动机是,vln模型对高频信息敏感,本文方法使得vl...
-
视频 论文阅读 强化学习 [2023][VTC]Environment-aware Dynamic Resource Allocation for VR Video Services in Vehicle Metaverse
1 作者信息2 背景与挑战车辆作为人们重要的出行工具之一,有机会成为虚拟世界的载体,从而提升车辆用户(vu 的驾驶体验和娱乐体验。在车载Metaverse中,vu可以通过头戴式显示器或挡风玻璃观看VR视频,VR视频被编码并缓...
-
图像处理 深度学习 论文笔记 图像融合论文阅读:CoCoNet: 基于多层特征集成的耦合对比学习网络多模态图像融合
论文级别:SCI A2 影响因子:19.5[论文下载地址]文章目录论文解读关键词核心思想甆网络结构甆耦合对比学习损失函数数据集训练设置实验评价指标聾Baseline实验结果传送门图像融合相关论文阅读笔...
-
语言模型 知识图谱 Unifying Large Language Models and Knowledge Graphs: A Roadmap 论文阅读笔记
...
-
深度学习 python 笔记 【论文阅读】:用于多元时间序列数据异常检测的深度变压器网络(三)
今天接着昨天的博文讲,忘了的伙伴可以返回去看看哦: 【论文阅读】:用于多元时间序列数据异常检测的深度变压器网络(一):https://blog.csdn.net/m0_72317955/art...
-
论文阅读 【论文笔记】Text2QR
论文:Text2QR: Harmonizing Aesthetic Customization and Scanning Robustness for Text-Guided QR Code Generation二维码通常包...
-
论文阅读 论文笔记:Bilinear Attention Networks
更精简的论文学习笔记1、摘要多模态学习中的注意力网络提供了一种选择性地利用给定视觉信息的有效方法。然而,学习每一对多模态输入通道的注意力分布的计算成本是非常昂贵的。为了解决这个问题,共同注意力为每个模态建立了两个独立的注意分...
-
【论文阅读笔记】Revisiting RCAN: Improved Training for Image Super-Resolution
论文地址:https://arxiv.org/abs/2201.11279 代码地址:https://github.com/zudi-lin/rcan-it论文小结 本文的工作,就是重新审视之前的RCAN,然后做实验来规范...
-
医学图像处理 【论文阅读】SynDiff Unsupervised Medical Image Translation with Adversarial Diffusion Models
Unsupervised Medical Image Translation with Adversarial Diffusion Models 论文大致翻译和主要内容讲解文章目录摘要:贡献:相关工作:方法:对抗性扩散过程:...
-
人工智能 python 视觉检测 【视频异常检测】Diversity-Measurable Anomaly Detection 论文阅读
Diversity-Measurable Anomaly Detection 论文阅读文章信息:发表于:CVPR 2023 原文链接:https://arxiv.org/abs/2303.05047 源码:https://g...
-
【论文阅读笔记】TimesURL: Self-supervised Contrastive Learning for Universal Time Series
摘要 学习适用于多种下游任务的通用时间序列表示,并指出这在实际应用中具有挑战性但也是有价值的。最近,研究人员尝试借鉴自监督对比学习(SSCL)在计算机视觉(CV)和自然语言处理(NLP)中的成功经验,以解决时间序列表示的问题...
-
数据挖掘 机器学习 人工智能 【论文阅读】深度加权多视图聚类的自监督图注意网络
原文链接 现有的基于gnn的MVC方法在训练过程中,普遍没有充分考虑到自监督信息的使用,从而无法取得较好的效果。为此,本文提出了用于深度加权多视图聚类的自监督图注意网络(SGDMC ,该网络利用自监督信息从两个方面增强了基于...
-
论文阅读笔记—— AdvFilter: Predictive Perturbation-aware Filtering against Adversarial Attack via Multi-d L
文章目录AdvFilter: Predictive Perturbation-aware Filtering against Adversarial Attack via Multi-domain Learning背景贡献相...
-
论文阅读之Meme-ingful Analysis: Enhanced Understanding of Cyberbullying in Memes Through Multimodal Exp..
文章目录论文地址主要内容主要贡献模型图技术细节实验结果论文地址主要内容这篇文章的主要内容是关于如何通过多模态解释来增强对网络霸凌(cyberbullying)在模因(memes)中的理解。文章首先指出,互联网模因在传播政治、...
-
论文阅读 语言模型 transformer 【论文笔记】Gemma: Open Models Based on Gemini Research and Technology
日期: March 5, 2024 平台: CSDN, 知乎 状态: Writing谷歌最近放出的Gemma模型【模型名字来源于拉丁文gemma,意为宝石】采用的是与先前Gemini相同的架构。这次谷歌开源了两个规模的模型,...
-
论文阅读《Domain Generalized Stereo Matching via Hierarchical Visual Transformation》
论文地址:https://openaccess.thecvf.com/content/CVPR2023/html/Chang_Domain_Generalized_Stereo_Matching_via_Hierarchic...
-
算法 人工智能 Learn from Others and Be Yourself in Heterogeneous Federated Learning论文阅读
联邦学习面临两大核心挑战:一是数据和模型的异构性问题,二是联邦学习过程中的灾难性遗忘问题。传统方法通常假设本地模型共享参数或梯度,但这不能适用于异构模型。为了解决这个问题,作者受自监督学习的启发,利用未标注的公共数据进行联合...
-
深度学习 论文阅读:PVT v2: Improved Baselines with Pyramid Vision Transformer
来源:PVTv1 和PVTv2链接:https://arxiv.org/pdf/2102.12122.pdf 链接:https://arxiv.org/pdf/2106.13797.pdfPVTv2是在PVTv1基础上,所以...
-
语言模型 人工智能 [arxiv论文阅读] LiDAR-LLM: Exploring the Potential of Large Language Models for 3D LiDAR Understanding
最近,大型语言模型(LLMs)和多模态大型语言模型(MLLMs)在指令跟随和2D图像理解方面表现出了潜力。虽然这些模型很强大,但它们尚未被开发成能够理解更具挑战性的3D物理场景,特别是在稀疏的户外LiDAR数据方面。在本文中...
-
论文阅读-高效构建检查点
论文标题:On Efficient Constructions of Checkpoints摘要高效构建检查点/快照是训练和诊断深度学习模型的关键工具。在本文中,我们提出了一种适用于检查点构建的有损压缩方案(称为LC-Che...
-
论文阅读 论文笔记: MOGRIFIER LSTM
修改传统LSTM当前输入和隐藏状态充分交互,从而获得更佳的上下文相关表达LSTM的输入X和隐藏状态H是完全独立的 机器学习笔记:GRU_gruc_UQI-LIUWJ的博客-CSDN博客这篇论文想探索,如果在输入LSTM之...