`
杨胜寒
  • 浏览: 284643 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论
文章列表
原创文章,转载请注明出处 本文地址:http://www.yshjava.cn/post/430.html   Spring MVC3的注解灵活强大,支持完全注解驱动,当放弃配置文件而完全采用注解配置时,你会被代码的简洁性深深吸引,这也是作者独立出一个篇幅来介绍其在Spring MVC3中的使用方法的根本原因。本文基于《Spring3_MVC注解教程》学习、总结而来,将从HTTP请求地址映射和通过注解绑定请求数据两个方面来介绍如何使用注解配置MVC,在此感谢作者的无私奉献,同时欢迎各位指点不妥之处。   HTTP请求地址映射   HTTP请求映射原理     Sprin ...
原创文章,转载请注明出处 本文地址:http://www.yshjava.cn/post/430.html   之前做Web应用都是在用Struts2,觉得功能强大,效率也能提升很多,所以一直都很喜欢Struts。虽然也曾经在接手前人遗留的项目时遭遇过Spring MVC,不过不知道是前人用的不好,还是自己水平差,亦或者是Spring MVC(那个时候还是2)本身的问题,让Spring MVC给自己留下了很不好的印象:配置文件繁琐、功能一般甚至简陋、不能够在开发效率上与Struts2媲美等等问题,致使自己一直以来都是带着偏见看待Spring MVC的,也因此一直都没有再去尝试过。 最 ...
  原文地址:http://www.yshjava.cn/post/423.html   最近Apache HttpClient发布了最新的4.3版本,据说有很多的改进,加入了新的设计思想和理念,使API更加简洁有力,闲来无事,做个Demo尝尝鲜。 在以前的3.x版本中,HttpClient就已经支持HTTPS连接了,但是代码写的比较多,而且用起来感觉挺别扭的,同样的功能,到了4这里,明显得简单清爽多了。 如下是来自官方的一个例子,稍加改造,并翻译了注释: package cn.ysh.studio.crawler.httpclient; import org.apache ...
查看原文请移步http://www.yshjava.cn/post/420.html HTTPClient4之后,基本重写了3的所有代码,使得API用起来更显简单有力,最简单的例子体现在get/post请求以及请求响应结果的处理上。3的时候,需要自己处理响应流,无论是网页编码识别还是代码处理等各方面,非常不便,4之后使用ResponseHandler可以非常方便和简洁地处理上述问题。如下代码演示了如何使用响应处理器(ResponseHandler)来处理HTTP响应。这是执行HTTP请求和处理HTTP响应的推荐方式。这种做法使调用者将注意力集中在处理HTTP响应内容的过程中,并委派任务释放H ...
查看原文请移步《http://www.yshjava.cn/post/415.html》   现在有越来越多的人热衷于做网络爬虫(网络蜘蛛),也有越来越多的地方需要网络爬虫,比如搜索引擎、资讯采集、舆情监测等等,诸如此类。网络爬虫涉及到的技术(算法/策略)广而复杂,如网页获取、网页跟踪、网页分析、网页搜索、网页评级和结构/非结构化数据抽取以及后期更细粒度的数据挖掘等方方面面,对于新手来说,不是一朝一夕便能完全掌握且熟练应用的,对于作者来说,更无法在一篇文章内就将其说清楚。因此在本篇文章中,我们仅将视线聚焦在网络爬虫的最基础技术——网页抓取方面。 说到网页抓取,往往有两个点是不得不说的,首 ...
来自《http://www.yshjava.cn/post/416.html》的一篇文章。 原生的JavaScript数组不能像Java中的List一样在任意位置插入和移除元素,而恰巧很多时候偏偏需要这样的功能,怎么办呢?只好对原生的JavaScript数组做一点扩展了... 扩展的代码非常简单,原理是向JavaScript的数组的原型中添加两个两个函数:insert和remove,分别负责向数组中指定位置插入元素和移除指定位置的元素。代码如下:  Array.prototype.insert = function(index, value) { if(index < 0){ ...
查看原文请移步《http://www.yshjava.cn/post/418.html》   Tomcat是Apache 软件基金会(Apache Software Foundation)的Jakarta 项目中的一个核心项目,由Apache、Sun 和其他一些公司及个人共同开发而成,是目前比较流行的Web 应用服务器。 Tomcat运行时占用的系统资源小,扩展性好,支持负载平衡与邮件服务等开发应用系统常用的功能而广受广大程序员的喜欢。Tomcat不仅有独立运行的版本,而且还提供了可以内嵌到JavaEE应用中的Embedded版本,这一点非常实用! 将Tomcat服务器嵌入到自己的应 ...
  原文请移步《FreeMarker中文手册:数值和类型》   数值 简介   这里假设你已经阅读完入门章节的内容了。 理解数值和类型的概念是理解数据模型的关键和基础。然而,数值和类型的概念并不局限于数据模型,下面你就会 ...
转载自 yshjava的个人博客主页 FreeMarker中文手册:模板一览 上一篇:《FreeMarker中文手册:模板开发入门》 FreeMarker中文版手册由南磊翻译(译者联系方式为:nanlei1987@gmail.com 或http://weibo.com/nanlei1987),官网地址http://www.freemarker.org  最简单的模板是普通HTML文件(或者是其他任何文本文件—FreeMarker本身不属于HTML)。当客户端访问页面时,FreeMarker 要发送HTML 代码至客户端浏览器端显示。如果想要页面动起来,就要在HTML中放置能被F ...
转载自yshjava的个人博客主页 《FreeMarker中文手册:模板开发入门》 下一篇:《FreeMarker中文手册:模板一览》 FreeMarker中文版手册由南磊翻译(译者联系方式为:nanlei1987@gmail.com 或http://weibo.com/nanlei1987),官网地址http://www.freemarker.org  简介 FreeMarker 是一款模板引擎:一种基于模板的、用来生成输出文本(任何来自于HTML格式的文本用来自动生成源代码)的通用工具。它是为Java 程序员提供的一个开发包或者说是类库。它不是面向最终用户,而是为程序员提 ...
本文转载自:http://www.yshjava.cn/post/333.html   FreeMarker作为"通用"模版引擎, 默认情况下不会对model中的值进行html转义, 然而在web项目中, 为了防止跨站脚本攻击等问题, 必须在对model中的值进行转义. 解决办法: 方法1. 是使用 ${x?html} 可以用于对单个值的转义方法2. 使用<#escape x as x?html> ... </#escape> 将需要转义的html代码包起来, 这样其中所有的值都会被转义了. 毫无疑问这两个方法都需要大量的重复操作, 如果我所有 ...
转载自 yshjava的个人博客主页 《文本去重第一步:基于内容的文本相似性计算》 为何要计算文档相似性       在今年年初的时候,我开始尝试做文本的自动聚类,当时是从网上,找到的一个K-Means算法,稍作了修改。 ...
今天的文章很简单,我要和大家谈谈“经验”是什么。首先,各位朋友找工作的时候都有过因为没经验被面试拒绝的问题吧,工作中也因为没有经验而比老员工干得累干得慢还干得差吧。那“经验”究竟是个什么玩意,让我们这么痴迷,恨不得生下来就有管理国家处理宇宙大事的经验——但实际上我们生下来只有哭的经验。 首先我们把话题扯开,先问你三个不相干的问题:第一,你是否能计算出一万以内的加减法?肯定没问题吧,那你能不能保证能算对两个随机数(如2467+3142)等于多少?请问这俩数字的加法你以前算过么?第二,在北京打车,一个很熟悉路况的的哥想带我们抄近路,结果被临时封锁的路段给堵得死死的,的哥明明很熟悉这附近的路况啊?第 ...
转载自 yshjava的个人博客主页 《基于分块统计和机器学习的主题类网页内容识别算法实现和应用范例》 周末两天在家闲着没事,于是整理了一下之前的的文档和一些琐碎的测试代码,居然发现了几个月前写的一个新闻类主题型网页正文文本自动抽取模块。当时写的比较简单和粗糙,虽然抽取结果差强人意,但是也还勉强说得过去。于是清理一下代码上的灰尘,做了一个小Demo,分享一下。   作者写这篇文章的主要目的在于抛砖引玉,同时希望能够以此为契机,与诸位大牛讨论一下机器网页内容智能识别方面的。作者自知才疏学浅,文中如有描述不当之处,请不吝指正,感激不尽!   应该说,在WEB分块领域,已经有 ...
转载自 yshjava的个人博客主页 《分享:网络舆情监控系统爬虫子系统开发心得与不足》 不知不觉,2011已经过去了,这一年中的大多时间,都花在了舆情监控系统的探索和研发上。尤其是作为舆情监控系统的基础子系统——网络爬虫系统,更是消耗了不少的时间和精力。下面简单分享一下在网络爬虫系统设计开发中的一些经验和不足。   首次接触爬虫,是在前年的时候,一次偶然的机会,从图书馆带回一本书中,夹带了一个网络爬虫的demo源码,当时只觉得非常敬仰那些能够写出爬虫程序的人,认为倘若有一天自己也能写一个网络爬虫出来,该是一件多么让人兴奋的事。后来工作之后,参与的第一个项目,就是网络舆情监控 ...
Global site tag (gtag.js) - Google Analytics