BR 技术头条
mp mp.weixin.qq.com / 2022-05-05 23:08 / by @code小生

这款功能强大的文本识别系统开源了!

说到文本识别大家已经非常熟悉了,这一技术早就深深融入我们生活的方方面面,今天,猿哥要和大家分享一个可以识别文本背后含义的工具——pyWhat。

当你不知道特定一串文本代表什么时,它能快速判断它是否是 email、油管视频编号、手机号 或者是其他信息格式。你给它一个 .pcap 文件或者一段文本,它能告诉你这个文件或是文本代表了什么。

赞过的人

@code小生

发表评论

相关分享

pa paper.seebug.org / 2024-03-21 22:56

JA 指纹识别全系讲解

近期在学习 Burp Suite 的反制时发现 Wfox 前辈写的反制爬虫之 Burp Suite RCE一文,文末处介绍了使用 JA3 指纹识别 Burp Suite 流量的方法,简单研究后发现实战中易用性较强,故借此机会完整介绍一下 JA 指纹的全系列,并拓展到实践中。

无图
li linux.cn / 2023-01-04 23:39

Linux QtFM 文件管理器的 3 个令人愉快的功能

QtFM 是一个简单的文件管理器,旨在通过一个快速直观的界面提供文件管理的基本功能。它适用于 Linux、BSD 和 macOS。

QtFM,顾名思义,使用 Qt(规范发音为 “cute”)编程工具包。我在 C++ 和 Python 中使用过 Qt 工具包,使用它总是一种乐趣。它是跨平台的,具有多个有用的抽象级别,因此开发人员不必直接与特定于供应商的 SDK 交互,而且它具有高度可配置性。从用户的角度来看,无论你使用的是最新的硬件还是旧计算机,这都是一种“自然”且快速的体验。

无图
52 www.52nlp.cn / 2022-12-24 23:30

海量文本中挖掘人物关联关系核心技术介绍

在大数据时代,通过对目标人物的轨迹、通信、社交、出行、网络等多模态行为进行挖掘并建立人物画像模型,并依托人物基础特征和高层特征,实例化人物画像,支撑有关部门分析人员全方位了解目标人物的行为、活动、状态、基本属性等信息,同时能够基于人物画像指导人物活动规律分析、人物能力分析、人物动向分析等应用。

无图
so soulteary.com / 2022-09-12 22:39

向量数据库入坑:传统文本检索方式的降维打击,使用 Faiss 实现向量语义检索

在上一篇文章[《聊聊来自元宇宙大厂 Meta 的相似度检索技术 Faiss》]中,我们有聊到如何快速入门向量检索技术,借助 Meta AI(Facebook Research)出品的 faiss 实现“最基础的文本内容相似度检索工具”,初步接触到了“语义检索”这种对于传统文本检索方式具备“降维打击”的新兴技术手段。有朋友在聊天中提到,希望能够聊点更具体的,比如基于向量技术实现的语义检索到底比传统文本检索强多少,以及是否有局限性,能不能和市场上大家熟悉的技术产品进行一个简单对比。那么,本篇文章就试着从这个角度来聊聊。

无图
mp mp.weixin.qq.com / 2022-08-14 09:25

微信这个扰人的功能终于下线了

前不久,微信支付运营方财付通支付科技有线公司发出通知,为了保障用户权益,提升用户使用体验,我司将于2021年9月1日起下线支付后推荐关注公众号功能。

无图
so soulteary.com / 2022-07-24 20:56

使用容器方式编译无功能限制的 Drone CI

因为默认版本的 Drone 包含构建次数限制,如果日常高频使用 Drone,不久之后,便会遇到需要“重新初始化”应用才能继续使用的问题,但其实,作为个人用户,我们其实可以不受此限制影响。所以本篇文章,就来分享下如何使用容器方式构建无使用限制的 Drone CI。

无图
se www.sec-un.org / 2022-06-19 23:19

洋葱式信息安全观察:浅议虚假信息识别

虚假信息对经济、政治等有着重大影响,因此研究威胁信息检测的重要性也凸显出来,尤其是在这个全球“抗疫”的时期。虚假信息的检测方法和技术很多,本文仅进行了部分介绍。需要注意的是,数据集对虚假信息检测的准确性也有很大影响,需要我们重点关注。
互联网时代检测虚假信息虽然很棘手,但事实证明通过大量的知识积累,我们仍然可以在检测虚假信息的工作上取得良好效果。

无图
bl blog.codingnow.com / 2022-06-19 23:07

给 ECS 增加分组功能

目前,我们用 ECS 管理游戏引擎中的对象。当游戏场景大到一定程度,就需要有一个机制来快速筛选出需要渲染的对象子集。换句话说,如果你创建了 100K 个 Entity ,但是只有 1K 个 Entity 需要同时渲染,虽然遍历所有可渲染对象的成本最小是 O(n) ,但这个 n 是 100K 这个数量级,还是 1K 这个数量级,区别还是很大的。

我们的 ECS 系统已经支持了 tag 这个特性,可以利用 visible tag 做主 key 快速筛选可见对象。但当镜头移动时,需要重置这些 tag 又可能有性能问题。重置这些 visible tags 怎样才能避免在 100K 这个数量级的 O(n) 复杂度下工作?

无图