mp mp.weixin.qq.com / 2022-05-05 23:08 / by @code小生

这款功能强大的文本识别系统开源了！

说到文本识别大家已经非常熟悉了，这一技术早就深深融入我们生活的方方面面，今天，猿哥要和大家分享一个可以识别文本背后含义的工具——pyWhat。

当你不知道特定一串文本代表什么时，它能快速判断它是否是 email、油管视频编号、手机号或者是其他信息格式。你给它一个 .pcap 文件或者一段文本，它能告诉你这个文件或是文本代表了什么。

赞过的人

@code小生

相关分享

pa paper.seebug.org / 2024-03-21 22:56

JA 指纹识别全系讲解

近期在学习 Burp Suite 的反制时发现 Wfox 前辈写的反制爬虫之 Burp Suite RCE一文，文末处介绍了使用 JA3 指纹识别 Burp Suite 流量的方法，简单研究后发现实战中易用性较强，故借此机会完整介绍一下 JA 指纹的全系列，并拓展到实践中。

查看详情

无图

zh www.zhangxinxu.com / 2023-01-10 00:07

前端原生API实现条形码二维码的JS解析识别

今天才知道，原来浏览器有原生的API，可以对二维码、条形码进行解析，使用非常简单！

查看详情

无图

bl blog.nsfocus.net / 2023-01-04 23:42

论文分享｜基于被动DNS流量分析的大规模IoT设备识别系统

如何通过被动流量识别IoT设备？如何检测分配了IPv6地址、NAT后的IoT设备？本文介绍了IoTFinder系统有效解决上述问题。

查看详情

无图

li linux.cn / 2023-01-04 23:39

QtFM 是一个简单的文件管理器，旨在通过一个快速直观的界面提供文件管理的基本功能。它适用于 Linux、BSD 和 macOS。

QtFM，顾名思义，使用 Qt（规范发音为 “cute”）编程工具包。我在 C++ 和 Python 中使用过 Qt 工具包，使用它总是一种乐趣。它是跨平台的，具有多个有用的抽象级别，因此开发人员不必直接与特定于供应商的 SDK 交互，而且它具有高度可配置性。从用户的角度来看，无论你使用的是最新的硬件还是旧计算机，这都是一种“自然”且快速的体验。

查看详情

无图

52 www.52nlp.cn / 2022-12-24 23:30

海量文本中挖掘人物关联关系核心技术介绍

在大数据时代，通过对目标人物的轨迹、通信、社交、出行、网络等多模态行为进行挖掘并建立人物画像模型，并依托人物基础特征和高层特征，实例化人物画像，支撑有关部门分析人员全方位了解目标人物的行为、活动、状态、基本属性等信息，同时能够基于人物画像指导人物活动规律分析、人物能力分析、人物动向分析等应用。

查看详情

无图

so soulteary.com / 2022-09-12 22:39

向量数据库入坑：传统文本检索方式的降维打击，使用 Faiss 实现向量语义检索

在上一篇文章[《聊聊来自元宇宙大厂 Meta 的相似度检索技术 Faiss》]中，我们有聊到如何快速入门向量检索技术，借助 Meta AI（Facebook Research）出品的 faiss 实现“最基础的文本内容相似度检索工具”，初步接触到了“语义检索”这种对于传统文本检索方式具备“降维打击”的新兴技术手段。有朋友在聊天中提到，希望能够聊点更具体的，比如基于向量技术实现的语义检索到底比传统文本检索强多少，以及是否有局限性，能不能和市场上大家熟悉的技术产品进行一个简单对比。那么，本篇文章就试着从这个角度来聊聊。

查看详情

无图

mp mp.weixin.qq.com / 2022-08-14 09:25

微信这个扰人的功能终于下线了

前不久，微信支付运营方财付通支付科技有线公司发出通知，为了保障用户权益，提升用户使用体验，我司将于2021年9月1日起下线支付后推荐关注公众号功能。

查看详情

无图

so soulteary.com / 2022-07-24 20:56

使用容器方式编译无功能限制的 Drone CI

因为默认版本的 Drone 包含构建次数限制，如果日常高频使用 Drone，不久之后，便会遇到需要“重新初始化”应用才能继续使用的问题，但其实，作为个人用户，我们其实可以不受此限制影响。所以本篇文章，就来分享下如何使用容器方式构建无使用限制的 Drone CI。

查看详情

无图

se www.sec-un.org / 2022-06-19 23:19

洋葱式信息安全观察：浅议虚假信息识别

虚假信息对经济、政治等有着重大影响，因此研究威胁信息检测的重要性也凸显出来，尤其是在这个全球“抗疫”的时期。虚假信息的检测方法和技术很多，本文仅进行了部分介绍。需要注意的是，数据集对虚假信息检测的准确性也有很大影响，需要我们重点关注。
互联网时代检测虚假信息虽然很棘手，但事实证明通过大量的知识积累，我们仍然可以在检测虚假信息的工作上取得良好效果。

查看详情

无图

bl blog.codingnow.com / 2022-06-19 23:07

给 ECS 增加分组功能

目前，我们用 ECS 管理游戏引擎中的对象。当游戏场景大到一定程度，就需要有一个机制来快速筛选出需要渲染的对象子集。换句话说，如果你创建了 100K 个 Entity ，但是只有 1K 个 Entity 需要同时渲染，虽然遍历所有可渲染对象的成本最小是 O(n) ，但这个 n 是 100K 这个数量级，还是 1K 这个数量级，区别还是很大的。

我们的 ECS 系统已经支持了 tag 这个特性，可以利用 visible tag 做主 key 快速筛选可见对象。但当镜头移动时，需要重置这些 tag 又可能有性能问题。重置这些 visible tags 怎样才能避免在 100K 这个数量级的 O(n) 复杂度下工作？

查看详情

无图

这款功能强大的文本识别系统开源了！

赞过的人

发表评论

相关分享

JA 指纹识别全系讲解

前端原生API实现条形码二维码的JS解析识别

论文分享｜基于被动DNS流量分析的大规模IoT设备识别系统

Linux QtFM 文件管理器的 3 个令人愉快的功能

海量文本中挖掘人物关联关系核心技术介绍

向量数据库入坑：传统文本检索方式的降维打击，使用 Faiss 实现向量语义检索

微信这个扰人的功能终于下线了

使用容器方式编译无功能限制的 Drone CI

洋葱式信息安全观察：浅议虚假信息识别

给 ECS 增加分组功能